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A Yvonne, 
perché mantiene nella calma dell’eta 
tutta la dolcezza dei desideri della gioventù... 


QUELLO DI CUI LA NATURA 
NON HA BISOGNO 


Oh, non ragionare sul bisogno! I 
più umili mendicanti hanno pur 
sempre il superfluo. Se alla natura 
non si concede più di quello di cui 
la natura ha bisogno, la vita 
dell’uomo è misera come quella 
della bestia. 

SHAKESPEARE, Re Lear, atto II, scena 4 


È una possibilità che ci sia qualcosa 
che proprio non capiamo, che esso 
sia davvero così tanto diverso da 
ciò a cui stiamo pensando che non 
ci stiamo ancora pensando. 

LEONID KRUGLYAK, in «Nature», 456 (2008), p. 21 


1 
IL PROBLEMA DI WALLACE 


La struttura di questo libro è semplice. In questo capitolo 
enuncio un problema e delineo quella che ritengo sia la sua 
soluzione. Il resto del libro si compone di argomenti ed 
evidenze a supporto di questa soluzione. Sebbene sia 
abbastanza facile da enunciare, il problema ha parecchie 
ramificazioni che ci porteranno a esplorare i territori di 
molte discipline quali la biologia evolutiva, la 
paleoantropologia, la psicologia, la neurobiologia e la 
linguistica. State pur certi che, alla fine, tutto ci ricondurrà 
alla stessa domanda iniziale, una delle più cruciali che si 
possano porre: in che modo la specie umana ha acquisito 
una mente che sembra di gran lunga più potente di quanto 
agli esseri umani serva effettivamente per sopravvivere? 

Visto che ormai si usa dare ai problemi il nome di chi per 
primo li ha sollevati (c’è il problema di Platone, quello di 
Darwin, quello di Orwell, ecc.), chiameremo il nostro il 
problema di Wallace, poiché il primo a formularlo in 
maniera chiara e univoca fu Alfred Russel Wallace, 
cofondatore insieme a Darwin della teoria dell’evoluzione 
per selezione naturale. Per dirla con le sue stesse parole: 
«La selezione naturale avrebbe potuto dotare i selvaggi di 
un cervello di poco superiore a quello di una scimmia, 
mentre essi possiedono un cervello che è di poco inferiore a 
quello di un membro medio delle nostre società 
scolarizzate» (Wallace 1869, pp. 391-92). Con «selvaggio», 
l’espressione usata in generale a quel tempo, Wallace 
intendeva semplicemente qualcuno che aveva avuto quella 
che molti, oggi, considererebbero l’enorme fortuna di 
essere nato in una società senza scrittura e pre-industriale. 


La sua considerazione della capacita intellettuale dei 
«selvaggi» era abbastanza illuminata per l’epoca - ci 
sarebbero voluti decenni prima che qualcuno avesse 
l’onesta di sostituire quel «di poco inferiore» con «eguale». 
Eppure, riconoscere l’universalità dell’intelligenza umana 
ha portato a Wallace soltanto problemi e inquietudine. 

Se l'evoluzione fosse un processo graduale e la selezione 
naturale rispondesse solamente alle esigenze imposte agli 
animali dall'ambiente che abitano, allora gli esseri umani 
dovrebbero avere un cervello «di poco superiore a quello di 
una scimmia». Un cervello leggermente migliore di quello 
di una scimmia sarebbe comunque bastato per superare in 
intelligenza qualsiasi altra cosa si muovesse su due o 
quattro zampe e raggiungere così la cima della catena 
alimentare. I primi umani non avevano bisogno di occuparsi 
di matematica, di costruire barche, di comporre musica o di 
avere idee circa la natura dell'universo per poter fare tutte 
le cose che in concreto facevano. Il fatto che, 
all'improvviso, scoprissero di essere dotati di un cervello 
che potenzialmente avrebbe potuto renderli capaci di tutte 
queste cose era già abbastanza notevole. Ma ancor più 
straordinario era che quegli stessi cervelli avrebbero reso 
capaci coloro che li possedevano di ricoprire il mondo 
intero delle proprie opere, di immergersi negli abissi più 
profondi degli oceani e addirittura (meno di mezzo secolo 
dopo la morte di Wallace) di lasciarsi alle spalle la Terra. 

Wallace non riusciva a credere che la selezione naturale 
avesse potuto fare tutto ciò: una qualche forza 
sovrannaturale doveva essere intervenuta per creare in 
maniera improvvisa e inattesa l'immenso divario che 
sussiste tra le capacità mentali umane e quelle di ogni altra 
specie. Tale divario sembrava davvero qualcosa di 
eccezionale perché nulla di simile esisteva altrove in 
natura. Ciò che si dava negli altri casi era precisamente 
quello che la teoria della selezione naturale avrebbe 
predetto: qualche isola di adattamento altamente compito- 


specifico, sullo sfondo di una altrimenti graduale 
distribuzione delle capacità cognitive attraverso l’intero 
range delle specie. 

Molti di coloro che hanno scritto di storia della teoria 
evoluzionista hanno attribuito le teorie di Wallace 
sull'evoluzione umana alla sua conversione allo 
spiritualismo - un buon modo per far scomparire del tutto il 
suo problema. Ma, a prescindere dalle convinzioni dello 
stesso Wallace, il problema che egli ha sollevato rimane. La 
mente umana è uno sviluppo evolutivo del tutto 
improbabile, da qualsiasi punto la si guardi; e dovremmo 
rendere onore all’onesta che Wallace mostrò nell’affrontare 
questo problema, indipendentemente dalle nostre 
inclinazioni personali nei confronti della soluzione che egli 
proponeva. 

Sebbene Wallace sia stato il primo a dare una chiara 
articolazione al problema, quasi certamente altre menti 
illustri di epoche precedenti ne furono in qualche modo 
consapevoli. Quando Shakespeare scrisse i versi riportati in 
esergo all’inizio di questo libro, presumibilmente non 
intendeva esprimere altro che la rabbia di Lear nei 
confronti della figlia che aveva ridotto il numero dei suoi 
servitori. Ma con Shakespeare c’è sempre un livello 
ulteriore di significato nascosto tra le righe (una delle 
ragioni per cui è il più grande tra gli scrittori). E in queste 
righe si cela la sua consapevolezza che anche «i più umili» 
tra gli uomini possedessero molto di più di quanto non 
servisse per meri scopi di sussistenza materiale e che, 
paragonate alle nostre, le vite delle «bestie» sono di gran 
lunga più limitate. Come questo sia potuto accadere senza 
l'intervento di una qualche misteriosa forza esterna 
all'evoluzione è il tema di questo libro. 


LA RISPOSTA DI DARWIN 


Senz’altro Darwin si rese conto del problema: «Non puo 
esservi dubbio che la differenza tra la mente dell’uomo 
inferiore e quella dell’animale superiore sia immensa» 
(Darwin 1871, p. 100 [trad. it. p. 106]). Egli mostrava la 
stessa considerazione di Wallace nei confronti dei 
«selvaggi», notando «quanto strettamente ci 
assomigliassero nelle loro disposizioni e in molte delle 
nostre facoltà mentali» (p. 34 [trad. it. p. 63]) i tre fuegini 
che si trovavano a bordo del Beagle. Tuttavia, allo stesso 
tempo, aveva ingegnosamente disarmato l’argomento del 
divario tra scimmia ed essere umano sostenendo che «vi è 
una differenza molto maggiore di capacità mentale tra uno 
dei pesci inferiori ... e una delle scimmie superiori, che tra 
questa e un uomo» (loc. cit.). Se c'era una gradazione in un 
caso, allora, nonostante le apparenze, doveva esserci anche 
nell'altro, e infatti «si può dimostrare che non c’è 
differenza fondamentale tra l’uomo e i mammiferi 
superiori» (loc. cit. [p. 64]). 

Questo però è un mero gioco di prestigio. La gradazione 
d’intelletto tra una lampreda e uno scimpanzé non è un 
argomento contro il divario ma a favore di esso. Se vi sono 
innumerevoli specie dotate di capacità a metà strada tra 
quelle di una lampreda e quelle di uno scimpanzé, 
dovrebbero esserci anche molte specie intermedie tra 
esseri umani e scimpanzé. Come mai, allora, non ci sono 
animali dotati di una piccola o moderata quantità di 
autocoscienza, né c'è un aumento graduale della capacità 
di innovazione o della creatività, né ci sono livelli diversi di 
produzioni artistiche (anche solo in una singola arte o in 
due), o per lo meno un linguaggio rudimentale? Il mero 
asserire che non vi è nessuna «differenza fondamentale» 
non è (e non avrebbe potuto essere, neppure al tempo di 
Darwin) un pronunciamento scientifico. Era ed è una pura e 
semplice dichiarazione di fede. 

Darwin aveva cercato un fondamento empirico per questa 
sua dichiarazione avvalendosi degli stessi metodi che aveva 


usato per supportare le proprie tesi nell’Origine delle 
specie: accumulando un’ampia scorta di resoconti a 
carattere aneddotico circa il comportamento degli altri 
animali. Ma quello che funziona quando ci sono delle 
evidenze oggettive nella conformazione fisica delle varie 
specie funziona molto meno quando si tratta di capacità 
mentali. Dal momento che non vi sono dati oggettivi e non 
ambigui a supporto di questi aneddoti, ci si deve affidare 
ciecamente alle interpretazioni soggettive, le quali, come è 
noto, sono incerte e inaffidabili. La tendenza tipica degli 
esseri umani ad antropomorfizzare marchia troppe di 
quelle evidenze. 

Eppure, anche in questo caso, Darwin, pensatore sempre 
cauto, trova un modo per salvaguardarsi. Egli continua a 
professare la propria fede nel fatto che «la differenza 
mentale tra l’uomo e gli animali superiori, per quanto sia 
grande, è certamente di grado e non di genere». Ma gli 
esempi che porta in quello stesso paragrafo fanno tutti 
riferimento alle emozioni più che ai processi cognitivi. Si 
sente costretto a suggerire subito un piano alternativo: «Se 
si potesse provare che alcuni elevati poteri mentali, come 
la formazione di concetti generali, l’autocoscienza, ecc. 
sono assolutamente peculiari all'uomo, il che sembra 
estremamente dubbio, non sarebbe improbabile che queste 
qualità apparissero come il risultato incidentale di altre 
facoltà intellettuali altamente avanzate e queste ancora 
principalmente il risultato dell'uso continuo di un 
linguaggio perfetto» (p. 101 [trad. it. p. 106]). 

Si trattava di un'intuizione brillante, ma al tempo di 
Darwin non poteva essere molto più di una cambiale. 
Darwin non la riscosse, e nemmeno era possibile farlo nella 
seconda metà del diciannovesimo secolo, né basandosi su 
delle ipotesi né, tantomeno, su dei meccanismi plausibili 
supportati da evidenze empiriche. Inoltre, per Darwin, essa 
rimaneva pur sempre un piano B, qualcosa di cui egli 
credeva non avrebbe mai avuto bisogno. La ricerca futura - 


deve aver pensato - avrebbe sicuramente individuato in 
dettaglio i pezzi mancanti e fatto le scoperte che avrebbero 
mostrato come le facolta animali siano solo di poco inferiori 
a quelle umane. 

E così è stato per un secolo. Nessuno ha tentato di 
risolvere il problema di Wallace. Addirittura, nessuno ha 
ammesso che il problema ci fosse - e in questo modo tutti si 
sono salvati dalla difficile, se non impossibile, incombenza 
di dover rendere conto del perché non fosse un problema. 
Certo, per un creazionista o per chi credeva in una 
qualsiasi forma di intervento spirituale, non vi era 
problema alcuno: semplicemente, Dio, o la Forza Vitale, 
aveva creato le cose in questo modo. Nulla evidenzia 
l’inettitudine intellettuale dei creazionisti e di chi crede nel 
disegno intelligente meglio della loro assoluta incapacità di 
sfruttare questo problema. Nei loro scritti, costoro 
dichiarano in continuazione che uno degli argomenti più 
forti di cui dispongono contro l’evoluzione è il «fatto» che 
non sia stata trovata alcuna forma intermedia tra scimmie 
ed esseri umani. Eppure, gli basterebbe un semplice clic 
per trovare una gran quantità di siti web che mostrano 
come, lungi dall'essere assenti, le forme intermedie siano 
in quantità addirittura imbarazzanti, e costituiscano una 
fonte inesauribile di dibattito fra i paleontologi - e non in 
merito alla questione se si tratti davvero di forme 
intermedie, ma semplicemente se esse siano da riferire ad 
antenati diretti degli esseri umani o a una loro 
ramificazione laterale; se un campione X vada assegnato 
alla specie A o alla specie B o se, in realtà, A e B non 
debbano essere considerate come un’unica specie 
(eccezion fatta per coloro che sostengono che B vada 
suddivisa nelle specie C e D). In altre parole, normale 
progresso scientifico. I creazionisti e quanti credono nel 
disegno intelligente si sono concentrati quasi 
esclusivamente sulla conformazione fisica, ambito per il 
quale disponiamo di abbondanti evidenze a favore della 


continuita evolutiva, piuttosto che sul comportamento 
cognitivo, dove invece le evidenze disponibili sono poche, 
se non assenti. 

Gli evoluzionisti dovrebbero essergli grati per questo 
errore di prospettiva. Il divario cognitivo tra umani e non- 
umani è il tallone d’Achille dell’evoluzione. Il problema di 
Wallace è reale, e gli evoluzionisti lo hanno semplicemente 
ignorato oppure hanno cercato di dare delle spiegazioni 
che lo facessero scomparire. A quanto ne so, l’unico che ha 
provato a riaffermarlo è David Premack (1986, p. 133), il 
quale ha fatto notare che «il linguaggio umano è fonte di 
imbarazzo per la teoria evoluzionista, perché è molto più 
potente di quanto si possa spiegare nei termini delle forze 
selettive». Tutti gli altri si sono limitati a ripetere, in un 
modo o nell’altro, il mantra secondo cui gli esseri umani 
sono solo «un’altra specie unica» (Foley 1987). I ricercatori 
hanno compilato liste lunghissime - e questa volta sulla 
base di qualcosa di più di semplici evidenze aneddotiche - 
di tutte le cose intelligenti che gli altri animali sono in 
grado di fare (per esempio, si vedano alcuni dei commenti a 
Penn et al. 2008). 

In certi ambienti è diventato politicamente scorretto 
anche solo accennare a tutte le cose intelligenti che gli 
esseri umani sono in grado di fare e gli animali no. Eppure, 
non v’è dubbio che queste cose esistano. «Gli esseri umani 
- e nessun altro animale - accendono fuochi e costruiscono 
ruote, fanno diagnosi delle malattie altrui, comunicano per 
mezzo di simboli, navigano con l’ausilio di mappe, rischiano 
la propria vita per degli ideali, collaborano gli uni con gli 
altri, spiegano il mondo in termini di cause ipotetiche, 
puniscono i forestieri perché infrangono le leggi, 
immaginano scenari possibili e si insegnano a vicenda come 
fare tutte le cose appena menzionate» (Penn et al. 2008, p. 
109). Come è possibile questo, se è vero che «da oltre 
trentacinque anni i ricercatori hanno dimostrato attraverso 
esperimenti sul campo e in laboratorio che le capacità degli 


animali non umani di risolvere problemi complessi sono in 
continuita con quelle degli umani»? (Pepperberg 2005, p. 
49). Una prima reazione è ovviamente quella di dire che tali 
affermazioni non possono essere vere entrambe. Ma il 
punto è che lo sono entrambe. Questo è soltanto uno dei 
paradossi che il problema di Wallace ci costringe, o 
dovrebbe costringerci, ad affrontare. 

Nella pratica questo non accade, perché, dopo che 
Premack ha rispolverato il problema in modo abbastanza 
brusco, vi è stato solo silenzio. Persino Noam Chomsky - il 
quale per molti anni ha insistito sul punto che per lo meno 
il linguaggio sia qualcosa di completamente slegato da ogni 
altra cosa che gli altri animali facciano - è infine ritornato 
all’ovile e ha accettato il punto di vista tradizionale, 
secondo il quale gli altri animali, presi individualmente o 
considerati nel loro complesso, possiedono tutti gli 
elementi richiesti per il linguaggio - eccezion fatta per uno, 
forse (Hauser et al. 2002; Chomsky 2007). Di sicuro, però, 
non passerà molto tempo prima che qualche creazionista o 
qualcuno che crede nel disegno intelligente capisca che il 
problema di Wallace è proprio il «grimaldello» di cui vanno 
sempre parlando (Johnson 1997). Quando accadrà, la 
scienza si troverà in una posizione molto imbarazzante 
poiché, ora come ora, una soluzione scientifica al problema 
di Wallace semplicemente non esiste. 


LA CHIAVE D’ACCESSO AL PROBLEMA 


La chiave d’accesso al problema sta nel piano B di Darwin 
citato poc'anzi: «... non sarebbe improbabile che queste 
qualità [la formazione di concetti generali, l’autocoscienza, 
ecc.] apparissero come il risultato incidentale di altre 
facoltà intellettuali altamente avanzate e queste ancora 
principalmente il risultato dell'uso continuo di un 
linguaggio perfetto». 


Se avanzata in maniera seria, questa idea é destinata a 
incontrare la diffidenza degli utenti. Per molti il linguaggio 
è un semplice «mezzo di comunicazione». Alla stregua del 
codice Morse o delle luci del semaforo, esso non è di per sé 
costitutivo del significato, ma si limita a trasmettere 
significati che hanno origine altrove. Prima si devono 
«avere dei pensieri», i quali vengono poi rivestiti con parole 
- anche se che cosa sia esattamente un pensiero e da dove 
provenga è molto meno chiaro di che cosa siano e da dove 
provengano le parole. Per costoro, le cose stanno al 
contrario di quanto suggerisce Darwin: prima deve essersi 
sviluppata l'intelligenza umana e soltanto in seguito, dopo 
un lungo periodo di sviluppo, è potuto emergere qualcosa 
come il linguaggio. 

È estremamente difficile definire che cosa sia 
l’«intelligenza» e, se ci venisse chiesto di farlo, sarebbe 
arduo trovare altre specie le cui abilità particolari 
derivassero da un qualche genere di «intelligenza 
generale» superiore che le distinguesse da tutte le altre. In 
genere, vale il contrario. Nel caso delle specie non umane, 
è palese che le abilità cognitive sono mirate a 
comportamenti molto specifici: l'intelligenza del ragno per 
tessere la tela, quella del castoro per la costruzione della 
diga, quella del pipistrello per l’ecolocazione, quella 
dell’ape per raccogliere il polline, e così via. Nel caso delle 
scimmie, potrebbe sembrare che vi sia un’intelligenza 
focalizzata in un senso meno ristretto che nelle specie 
appena menzionate. È come se l’intelligenza sociale, 
notoriamente il loro piatto forte, si fosse riversata in altre 
aree - uno sviluppo abbastanza naturale, dal momento che 
per poter funzionare l’intelligenza sociale deve essere più 
flessibile e capace di adattarsi a ruoli e livelli di stato 
gerarchici in costante cambiamento. È inoltre vero che le 
scimmie, al pari dei cani ma anche più di loro, possono 
essere addestrate a fare alcune cose che in genere solo gli 
esseri umani fanno. Tuttavia, lasciate a loro stesse, le 


scimmie non hanno mai innovato il genere di cose loro 
insegnato, mentre gli esseri umani hanno prodotto di 
continuo innovazioni in maniera spontanea - a meno che 
non siano stati istruiti da degli alieni venuti dallo spazio. 

Il significato di tutto questo è che, in termini evolutivi, 
qualsiasi «aumento di intelligenza» che non sia motivato 
dai bisogni specifici di una particolare nicchia di una specie 
è altamente improbabile, forse addirittura impossibile. 
Nella maggior parte dei casi, per non dire sempre, ciò che 
determina un aumento di intelligenza è lo sviluppo di una 
qualche abilità molto specifica che viene richiesta quando 
la specie deve risolvere un problema posto dall'ambiente, 
per esempio quello di catturare nelle ore notturne insetti 
volanti che si muovono velocemente e compiono abili 
manovre. Il modo in cui si attuano degli incrementi 
nell’intelligenza è solo uno degli aspetti di un processo 
evolutivo più generale che copre ogni aspetto della forma e 
del comportamento: «La diversità delle specie 
rappresenta una variazione nel design che suggerisce 
l'adattamento a compiti specifici» (Weibel 1998, p. 1, 
corsivo mio). 

Di norma, l’intelligenza specializzata non si espande a 
permeare altre aree, proprio perché deve essere focalizzata 
su un range molto ristretto di comportamenti. (Gardner 
[1983], con le sue «intelligenze multiple», e l'approccio da 
«coltellino svizzero» all'intelligenza tipico della psicologia 
evolutiva [per esempio, Barkow et al. 1992] affrontano 
problemi simili da prospettive piuttosto diverse). Ma, in 
casi molto rari, un genere di intelligenza inizialmente 
focalizzato può essere in grado di espandersi. 

Ciò che ancora manca è una qualche comprensione di 
come e perché, e in quali circostanze, un’intelligenza 
focalizzata possa espandersi - e in particolare come tutto 
ciò sia accaduto nel caso specifico degli esseri umani, e 
soltanto tra loro. Il tipo di risposta fornita è troppo spesso 
qualcosa del genere: «Una possibilità ... è che la ricorsività 


negli animali rappresenti un sistema modulare progettato 
per una funzione particolare (per esempio, la navigazione) 
e sia impenetrabile rispetto ad altri sistemi. Durante 
l’evoluzione, [questo sistema] può essere diventato 
penetrabile e può avere acquisito una generalità nel 
proprio dominio di applicazione ... Questo cambiamento da 
specificità a generalità nel proprio dominio di applicazione 
può essere stato determinato da particolari pressioni 
selettive, presenti unicamente nel nostro passato evolutivo, 
o come conseguenza (sottoprodotto) di altri generi di ri- 
organizzazione neurale» (Hauser et al. 2002, p. 1578). 
Queste parole non fanno che riaffermare il problema in un 
modo più complicato, senza gettare alcuna luce su di esso. 

Dovremo fare molto meglio di così. Dopo aver identificato 
la fonte-chiave dell’intelligenza umana, dovremo mostrare 
come quella particolare fonte sia stata in grado di creare 
l'illusione, del tutto convincente, che «le superiori facoltà» 
umane scaturiscano dal possesso di una qualche 
intelligenza onnicomprensiva e multiuso. 

Ma se seguiamo Darwin e identifichiamo quella fonte- 
chiave con il linguaggio, ci troviamo di fronte degli ostacoli 
seri. Senza dubbio, il linguaggio è un candidato ovvio, 
perché si tratta di una forma di comportamento molto 
specifica e specializzata, e perché i meccanismi attraverso i 
quali opera sono chiaramente identificabili e sono ben 
studiati (specie rispetto a cose quali l’astrazione, la 
coscienza, la capacità di fare previsioni o l'immaginazione). 
Per questo ben si adatta al consueto profilo evolutivo degli 
incrementi di intelligenza. Tuttavia esso non sembra offrire 
alcun indizio rispetto a come quell’intelligenza si sia potuta 
propagare attraverso l’intero spettro dei comportamenti. 
Pertanto, o il piano B di Darwin non funziona, oppure non 
abbiamo ancora una comprensione adeguata di ciò che il 
linguaggio è e fa. Io opterei per la seconda di queste due 
opzioni. 


Questa affermazione può sembrare arrogante ed errata 
allo stesso tempo, vista la quantità di teorie linguistiche 
elaborate da professionisti attenti. Sarebbe proprio così se 
non fosse per un fatto: le teorie del linguaggio, senza 
eccezioni, sono state elaborate sulla base di evidenze 
linguistiche sincroniche, senza prestare alcuna attenzione 
al linguaggio come risultato di processi evolutivi. Tutte le 
teorie del linguaggio appartengono all’una o all’altra di 
queste due (e soltanto queste due) classi: una sostiene che, 
se ci sono degli adattamenti biologici, pochi (e quasi tutti 
confinati alla produzione verbale) sono quelli che 
riguardano esclusivamente il linguaggio, il quale di 
conseguenza deve essere il risultato di sviluppi cognitivi 
più generali; l’altra sostiene che, a parte elementi 
periferici, il linguaggio (e in particolare la sintassi) sia 
determinato da meccanismi biologici che sono (qualora sia 
ancora necessario specificarlo) altamente compito-specifici. 

In termini di biologia evolutiva, entrambi gli approcci 
sono egualmente non plausibili. Da un lato, qualsiasi teoria 
neghi o minimizzi il ruolo di un’infrastruttura genetica 
compito-specifica per il linguaggio ignora che, in natura, 
nessun altro tratto specie-specifico ne è privo. Dall'altro, 
qualsiasi teoria enfatizzi la dimensione e/o la specificità 
dell’infrastruttura linguistica ignora che, per nessun altro 
tratto specie-specifico rilevante, l'infrastruttura genetica 
chiarisce non solo i processi di base richiesti da quel tratto, 
ma tutte le loro possibili variazioni. Eppure, questo è 
proprio ciò che viene richiesto da un Dispositivo di 
Acquisizione della Lingua (DAL) chomskiano (Chomsky 
1965). Un tale dispositivo deve essere equo: non può 
favorire una lingua rispetto a un’altra; deve rendere 
parimenti possibile l'apprendimento di ciascuna delle 
svariate migliaia di lingue presenti sulla Terra. 

Invece di queste alternative, qualunque biologo si 
appresti a studiare il linguaggio senza preconcetti derivanti 
dalla filosofia o dalla linguistica farebbe la seguente 


predizione: un componente genetico ha fornito la quantita 
minima di meccanismi di base necessari per il linguaggio e 
ha lasciato ogni variazione successiva a fattori ambientali. 
Solo un simile approccio può spiegare, al contempo, perché 
gli esseri umani, ma non altre specie, hanno un linguaggio 
e perché le lingue, pur seguendo lo stesso Bauplan, variano 
l'una rispetto all’altra in maniera non predicibile per 
quanto riguarda i dettagli strutturali. Solo un approccio del 
genere può integrare l’evoluzione del linguaggio nel quadro 
di un resoconto generale dell'evoluzione umana. E solo 
assumendo un simile approccio - cosa che a oggi nessuna 
teoria del linguaggio ha fatto - possiamo mostrare come la 
natura abbia dotato la nostra specie di capacità che, al 
momento, sono in eccesso rispetto ai suoi bisogni. 

Tuttavia, per comprendere appieno la comune nascita del 
linguaggio e della cognizione umana, dobbiamo 
innanzitutto affrontare in maniera corretta l'evoluzione del 
linguaggio. Se non capiamo come si sia evoluto, non 
sappiamo davvero che cosa esso sia, o quali siano le sue 
reali proprietà, o perché dovrebbe avere proprio quelle e 
non altre. 

Scoprire come il linguaggio si sia evoluto è stato definito 
«il problema più arduo della scienza» (Christiansen e Kirby 
2003, p. 1). Si tratta di un'affermazione estrema, ma 
apparentemente non irragionevole, dato che i tentativi di 
risolverlo si sono succeduti per secoli e comprendono 
innumerevoli teorie, ipotesi e vere e proprie congetture. Se 
l'affermazione è scorretta, come di fatto è, non è per colpa 
di Christiansen e Kirby. Infatti il motivo per cui l'evoluzione 
del linguaggio non e il problema più arduo della scienza 
non è che esso non sia arduo, ma che non si tratta di un 
problema solo. I problemi sono tre. 

Questo è il punto nodale in merito all'intera questione 
dell'evoluzione del linguaggio. È altresì il punto su cui 
questo libro si differenzia in maniera più netta dai lavori 
precedenti in questo campo - oltre a essere ciò che, in 


primo luogo, ha fatto apparire il problema tanto difficile. 
L'immagine cambia in maniera radicale non appena ci si 
rende conto che la difficoltà dipende dal fatto che si stanno 
mischiando mele con pere, combinando tre processi 
differenti sotto la comune etichetta di «evoluzione del 
linguaggio». Ora, invece che di fronte al «problema più 
difficile» - o «problema insolubile» come dovremo piuttosto 
chiamarlo -, ci troviamo di fronte a tre problemi, ciascuno 
dei quali è relativamente semplice da risolvere, una volta 
che sia stato distinto dagli altri. Ma c’è di più: adottare un 
terzetto di soluzioni differenti non solo si avvicina a una 
spiegazione dell'evoluzione del linguaggio che lo allinea 
agli sviluppi evolutivi riscontrabili nelle altre specie, ma ci 
porta anche a superare gli sterili, e all'apparenza infiniti, 
argomenti portati sia dagli empiristi sia dagli innatisti. 

La persistenza stessa di quegli argomenti avrebbe già 
dovuto dirci qualcosa. I dibattiti scientifici raramente 
durano così tanto, tranne quando le questioni non sono 
ancora state formulate in maniera corretta, con il 
conseguente effetto di sollevare le domande sbagliate. Il 
linguaggio stesso, poi, sembrava dirci che nessun singolo 
punto di vista sarebbe stato sufficiente a raggiungere un 
resoconto del tutto soddisfacente. La sua natura di Giano 
bifronte è stata messa brevemente in luce da Deacon 
(2010, p. 9005): «Il linguaggio è troppo complesso e 
sistematico, e noi lo acquisiamo in maniera troppo 
semplice, perché tutto questo possa essere spiegato in 
maniera adeguata soltanto in termini di uso culturale e 
apprendimento generale. D'altra parte, il processo 
dell'evoluzione è troppo intricato e legato a fattori esterni 
per aver prodotto questo fenomeno complesso tramite una 
mutazione fortunosa o l’internalizzazione genetica del 
comportamento linguistico». Purtroppo, nel proprio 
tentativo di spiegare come si sia evoluto il linguaggio, 
anche Deacon ha insistito su un solo fattore: la selezione 
rilassata. 


Il processo complessivo va invece suddiviso in tre 
sottoprocessi, ciascuno dei quali richiede domande e 
risposte separate. Il primo consiste nella fuga dalla 
prigione della comunicazione animale, e la domanda è 
come e perché tale fuga sia riuscita e quali siano stati i 
fattori coinvolti. Il secondo processo consiste 
nell’acquisizione di strutture molto basilari per affrontare 
la situazione creatasi con il primo processo, e di nuovo 
dobbiamo chiederci come e perché, e grazie a quali fattori, 
sia stata messa in atto la costruzione di questa struttura. Il 
terzo processo consiste nella creazione del linguaggio così 
come lo conosciamo oggi; ancora una volta, la domanda è 
come e perché, una volta emerso, il linguaggio abbia preso 
proprio quella forma, e che cosa (o chi) gliel’abbia data. 

Proporre delle risposte a queste tre domande ci mette 
nella condizione di scorgere perché il linguaggio abbia 
l'aspetto duale descritto da Deacon. Vedremo inoltre 
perché il dibattito tra innatisti ed empiristi sia continuato 
tanto a lungo. Ricordatevi di quel cieco dell’Hindustan che, 
avendo toccato parti diverse di un elefante, giunse alla 
conclusione di avere di fronte cose diverse: un serpente, 
una lancia, un tronco d’albero, e così via. Esattamente allo 
stesso modo, molti evoluzionisti del linguaggio hanno 
tastato parti diverse dell'elefante e hanno tratto conclusioni 
errate circa la natura dell'animale, confondendo la parte 
per il tutto. 

Ognuno ha colto una parte della verità: la selezione 
naturale, lo sviluppo interno e la cultura - tutte queste cose 
hanno giocato un ruolo nell'evoluzione del linguaggio. Il 
punto è che non hanno giocato il proprio ruolo 
contemporaneamente o all’interno dello stesso processo. La 
selezione naturale ha avuto la parte preminente nel primo 
processo. Nel secondo ce l’ha avuta lo sviluppo interno. Nel 
terzo, la cultura. 


LA STRUTTURA DI QUESTO LIBRO 


Per dare al lettore una bussola per orientarsi nel corso 
del libro, tratteggerò brevemente quelle che ritengo siano 
le ragioni alla base dei tre processi e dei mezzi attraverso i 
quali essi si sono realizzati. Il primo processo è stato 
guidato principalmente da fattori evolutivi esterni. Al pari 
della tessitura della tela, dell’ecolocazione, della 
costruzione della diga e di tutte le altre innovazioni 
comportamentali di cui siamo a conoscenza, esso è sorto 
non per mezzo di cambiamenti genetici immotivati, ma 
come risultato diretto di un problema ambientale preciso 
che la specie interessata - parente lontana degli esseri 
umani, circa due milioni di anni fa - ha dovuto fronteggiare. 
Come spesso accade, una risposta a un problema 
ambientale ha comportato la costruzione di una nuova 
nicchia ecologica (Odling-Smee et al. 2003); questa 
risposta, per sviluppare e sfruttare pienamente la nicchia, 
ha richiesto un dislocamento referenziale (la capacità di 
trasferire informazioni circa entità ed eventi collocati al di 
fuori del range di stimoli sensoriali immediatamente dati 
agli animali interessati). Il risultato del dislocamento è 
stato nient'altro che una forma di comunicazione animale 
potenziata. Gli antenati degli esseri umani avevano 
acquisito dei cervelli solo di poco migliori di quelli delle 
scimmie - cosa che avrebbe fatto felice Wallace. 

Nel caso delle formiche o delle api, la storia finì qui. In 
una specie dotata di un cervello di un ordine di grandezza 
superiore al loro, no. In quest’ultima, l’uso continuo del 
meccanismo del riferimento dislocato si estese ad aree al di 
fuori della funzione immediata di ricerca del cibo svolta 
dalla comunicazione potenziata. Più venivano usate, e per 
scopi sempre più numerosi, più queste unità dislocate - 
potremmo chiamarle proto-parole - assunsero via via il 
carattere di unità pienamente simboliche, e la 
rappresentazione neurale di ciascuna di esse venne 


collegata con un concetto (presumibilmente preesistente). 
Questo apri la strada a una serie di sviluppi molto diversi, 
una serie che Wallace non conosceva - e che non avrebbe 
potuto conoscere - perché ci sarebbe voluto ancora circa 
un secolo per raggiungere la necessaria comprensione di 
come opera il cervello. 

l’esistenza di rappresentazioni di unità simboliche 
all’interno del cervello innescò il secondo processo. Per 
centinaia di milioni di anni, i cervelli si sono auto- 
organizzati e auto-riorganizzati per gestire tramite i diversi 
sensi i flussi di informazioni provenienti dal mondo esterno. 
Tuttavia, nel caso degli antenati degli esseri umani, il 
cervello si trovò anche a dover rispondere a un sempre 
crescente bagaglio di parole e di concetti a esse associati, 
oltre che a gestire i flussi di informazioni che questi 
fenomeni creavano. Per farlo, dovette riorganizzare le 
proprie risorse, proprio come era successo ogniqualvolta 
un animale aveva sviluppato un nuovo senso. La 
ristrutturazione del cervello non è guidata da pressioni 
selettive provenienti dall'ambiente esterno, ma dal bisogno 
che il cervello stesso ha di risparmiare energia e di 
funzionare sfruttando il minor numero di connessioni 
neurali. Esso destinò o ri-allocò degli spazi per 
l'archiviazione delle proto-parole. Ridisegnò il diagramma 
delle proprie connessioni neurali in modo da connettere le 
parole ai relativi concetti, oltre a connetterle l’una all’altra 
e mettere in atto i controlli motòri richiesti dal discorso 
verbale. Dal momento che i suoi possessori si sforzavano 
goffamente di legare insieme sia le proto-parole sia i 
concetti per produrre (rispettivamente) proferimenti e 
pensieri, il cervello fu obbligato a sviluppare delle 
procedure routinarie semplici, stereotipate e interamente 
automatizzate per ridurre lo sforzo necessario per 
assemblare velocemente quelle cose ogni volta. Nulla di 
diverso era già accaduto nel caso di altri comportamenti 
ripetuti: gettare, raccogliere, colpire, ecc. 


Il motore sintattico che si era così sviluppato non sapeva 
nulla di pensieri e frasi. Quella distinzione, vitale per gli 
esseri umani, non è rilevante per il cervello. Il cervello 
conosce soltanto i complessi cellulari che archiviano le 
informazioni e gli impulsi neurali che le collegano fra loro 
e, a partire da esse, possono creare unità più ampie. 
Queste possono non viaggiare al di fuori del cervello: sono 
allora dei pensieri; oppure possono essere esternalizzate 
tramite gli organi motori della produzione verbale, in 
seguito a un ulteriore processo di elaborazione 
grammaticale, nel qual caso diventano frasi. In origine, non 
vi era alcun ulteriore processo di elaborazione 
grammaticale. Come se ne sia originato uno è la storia del 
terzo processo. 

Gli algoritmi automatici che assemblavano sia le parole 
sia i pensieri erano perfettamente adatti per pensare. Sia 
quando pensate sia quando parlate, vi serve conoscere le 
relazioni precise tra le cose di cui state parlando o a cui 
state pensando - chi (o che cosa) ha fatto che cosa a chi (0 
a che cosa), per chi (o per che cosa), con che cosa, come, 
quando, dove e, molto spesso, perché. Se non comprendete 
queste relazioni in maniera corretta, tutto ciò che avete è 
un insieme sconnesso di parole o di pensieri. Ma se quello 
che state facendo è pensare, allora voi conoscete già quelle 
relazioni: non vi devono essere spiegate. E lo stesso vale se 
state parlando. Ma se state parlando, in genere si dà il caso 
che ci sia qualcuno ad ascoltarvi, e costui non conosce, e 
non può conoscere, tali relazioni, a meno che non vengano 
messe in luce apertamente. Questo è un problema per gli 
esseri umani, ma non lo è affatto per i cervelli. 

Immaginate di essere un cervello umano. Perché mai 
dovrebbe interessarvi sapere se quello sgraziato sistema di 
supporto vitale che vi porta a spasso sia in grado di 
decodificare agevolmente il prodotto tanto ingegnoso che 
avete messo a sua disposizione? Quel sistema di supporto 
vitale vi ha reso la vita difficile inventandosi migliaia di 


parole, aspettandosi che le archiviaste per lui e insistendo 
nel legarle insieme per poi emetterle dalla bocca. In 
maniera molto leale, voi le avete archiviate affinché fossero 
accessibili all’istante e avete creato degli algoritmi che 
automaticamente hanno dato una forma a quegli insiemi 
sconnessi di parole e pensieri che erano tutto cio che quel 
bruto impacciato riusciva a maneggiare da solo. E ora 
costui vi viene a dire di non essere capace di elaborare 
queste cose? Eh no! 

Il cervello, quindi, non ha giocato alcun ruolo attivo nel 
terzo processo: quest’ultimo lo hanno iniziato gli esseri 
umani, lasciati a se stessi. Non è necessario supporre 
alcunché di cosciente o di intenzionale in tutto questo. È 
fuor di dubbio che, in principio, essi abbiano fatto quello 
che potevano con la (molto) rudimentale sintassi originaria. 
Ma tutto si modifica e di conseguenza cambia, e di tanto in 
tanto sarà apparsa qualche caratteristica accidentale che 
aiutava a dissipare certe ambiguità insite nella struttura. 
Queste caratteristiche hanno allora preso vita autonoma, 
per così dire, producendo talvolta un effetto a cascata che 
ha condotto a fenomeni come i casi del finlandese o 
dell’ungherese, i classificatori di nomi in cinese o come, in 
alcune lingue bantu, la necessità di attaccare un singolo 
morfema a ogni parola all’interno di una frase. Si noti che il 
comportamento di quelli che si potrebbero chiamare 
fenomeni sintattici di basso livello dipendono fortemente 
dal ceppo linguistico di appartenenza (Dunn et al. 2011): 
un fatto inspiegabile per qualsiasi teoria degli universali, 
sia essa chomskiana o greenberghiana, mentre segue 
direttamente da quanto viene proposto qui. 

Come abbiamo notato in precedenza, guardare 
all'evoluzione del linguaggio come risultato di tre processi 
separati evidenzia la vacuità degli sterili dibattiti tra teorie 
empiriste e innatiste e tra spiegazioni interniste ed 
esterniste. Ma manda anche in pensione quei dibattiti 
altrettanto sterili sulla relazione tra linguaggio e pensiero, 


come quello che ruota intorno alla domanda se esista o sia 
possibile un «linguaggio del pensiero». In precedenza, tale 
dibattito era viziato dall'idea che «pensare nel linguaggio» 
potesse significare soltanto pensare in una delle svariate 
migliaia di lingue conosciute. Non appena ci si rende conto 
che «pensare nel linguaggio» significa pensare con il mero 
output del motore sintattico, qualcosa che manca di tutte le 
caratteristiche che differenziano una lingua da un altra, il 
dibattito semplicemente si dissolve. 

Non solo si dissolve, ma possiamo anche apprezzare la 
ragione di un fatto indiscutibile, benché di rado notato. Per 
lo meno a livello superficiale, le lingue differiscono 
ampiamente. Nessuno parla allo stesso modo, ma, fatte 
salve alcune differenze minori in poche e limitate aree 
semantiche, tutti pensano allo stesso modo. La lingua che si 
parla negli Stati Uniti non è per nulla simile a quella dello 
Zimbabwe, ed entrambe differiscono dalla lingua della 
Cina. Ma americani, cinesi e zimbabwiani usano processi 
razionali identici e (al netto delle differenze culturali, che 
comunque oggigiorno stanno rapidamente venendo meno) 
pensano in maniera simile. Questo è un esito naturale, data 
una teoria che considera il linguaggio sintatticizzato come 
qualcosa né interamente innato né interamente appreso, 
ma piuttosto come il risultato della combinazione di 
componenti apprese e innate, con solo le seconde utilizzate 
nel pensiero. 

Dobbiamo però tenere a mente le nostre priorità. Lo 
scopo di questo libro è risolvere il problema di Wallace, 
mostrando come in pochi milioni di anni un primate senza 
nulla di particolare possa aver superato le capacità di tutti 
gli altri animali tramite dei normali processi evolutivi. Ma il 
raggiungimento di questo scopo si fonda sulla nostra 
capacità di riscuotere la cambiale del piano B di Darwin, 
evidenziando come il semplice possesso e uso del 
linguaggio possano aver dato agli esseri umani le capacità 
cognitive di cui dispongono. Per farlo, è necessario scoprire 


come possa essersi evoluto il genere di linguaggio in grado 
di eseguire questo compito. Ecco perché, inevitabilmente, 
una gran parte di questo libro sara dedicata a illustrare 
come il linguaggio sia evoluto. 

Inoltre, dovremo dedicare dello spazio per mettere alla 
prova questo resoconto dell’evoluzione del linguaggio. Non 
possiamo (non ancora, per lo meno) testarlo analizzando la 
preistoria, e ricorrendo a discipline ausiliarie (per esempio, 
la neurobiologia) faremo solo un test indiretto. Tuttavia un 
modo per metterlo alla prova direttamente c’é. Se é 
corretto, il resoconto proposto deve essere in grado di 
spiegare come i bambini acquisiscono la lingua in un modo 
più fedele ai fatti di quanto non facciano le teorie innatiste 
ed empiriste. Una volta assolti questi compiti, il problema 
di Wallace può essere risolto con un piccolo sforzo, proprio 
come suggeriva l’intuizione di Darwin. 

Nel dettaglio, questo libro è strutturato come segue. Nei 
capitoli 2 e 3 vengono chiarite le basi, rispettivamente, 
della linguistica e della teoria dell'evoluzione, visto che 
molto di quanto è stato pensato e scritto in questi ambiti è 
fuorviante e, se non ce ne occupiamo subito, ciò finirebbe 
per essere d’intralcio durante l’esposizione. I capitoli 4, 5 e 
6 affrontano rispettivamente, e in senso cronologico, 
ciascuno dei tre processi le cui linee generali sono state 
descritte sopra. I capitoli 7 e 8 mettono alla prova il 
modello illustrato nei capitoli precedenti analizzando il 
modo in cui la lingua viene acquisita dai bambini in 
condizioni normali (capitolo 7) ed eccezionali (capitolo 8). 
Nel capitolo 9, torniamo al problema di Wallace e ne 
riassumiamo la soluzione. 


2 
LA TEORIA GENERATIVA 


La teoria del linguaggio che ha più coerentemente 
sostenuto l’esistenza di una componente innata del 
linguaggio (e in particolare della sintassi) è senz'altro la 
teoria generativa di Chomsky. Quando è emersa, alla fine 
degli anni cinquanta, essa ha dato nuovo vigore a un 
ambito della ricerca fino ad allora decisamente poco 
promettente. Gli studi sulla sintassi consistevano in 
descrizioni che erano poco più che elenchi di costruzioni. 
Non veniva data alcuna spiegazione del perché il 
linguaggio fosse fatto così e funzionasse in quel modo. Per 
le generazioni di studiosi che si erano formati sulle teorie 
di una psicologia dell’inconscio, la distinzione che Chomsky 
(1957) propose (per poi sbarazzarsene quarant'anni dopo) 
tra strutture profonde e strutture superficiali sembrò 
suggerire che la linguistica fosse in procinto di fare delle 
scoperte profonde sulla mente umana. La rivelazione che le 
precedenti teorie della grammatica erano solo delle liste di 
eccezioni e che esse non avevano mai neppure menzionato 
le sue caratteristiche più interessanti (poiché erano comuni 
a tutte le lingue, e quindi venivano date per scontate) 
parve, agli occhi degli studiosi della metà del ventesimo 
secolo, come una novità assoluta, per quanto affondasse le 
proprie radici nel pensiero del diciassettesimo secolo - 
come lo stesso Chomsky (1966) fece notare abbastanza 
presto. Attorno al 1960, un irrefrenabile desiderio di 
saltare sul carro della teoria generativa per condurlo 
ovunque fosse destinato ad andare fu probabilmente la 
reazione più comune sia tra i linguisti sia tra coloro che 
lavoravano nell’ambito della vicina scienza del 


comportamento, e in particolare in psicologia. Forse fu un 
caso o forse no, fatto sta che questo tipo di sentimenti e 
reazioni rifletteva l’ottimismo tipico dell’epoca - proprio 
come gli attuali cinismo e pessimismo nei confronti 
dell'impresa della teoria generativa rispecchiano gli 
infausti presentimenti che caratterizzano la seconda 
decade del nuovo secolo. 

Sia come sia, il carro della grammatica generativa ha 
viaggiato veloce ed è andato lontano. È istruttivo mettere a 
confronto le bibliografie degli scritti di grammatica 
generativa in ciascuno dei decenni successivi. Difficilmente 
troviamo dei nomi che ricorrano per tutto l’arco temporale 
dello sviluppo della disciplina; e relativamente pochi sono 
quelli che rimangono per più di un decennio. A mano a 
mano che esso procedeva per la sua tortuosa strada, 
sempre più viaggiatori sono saltati giù dal carro, o sono 
stati gettati giù, perché incapaci di affrontare gli apparenti 
cambi di direzione e di comprendere cosa vi fosse di 
scorretto nel paradigma che, di volta in volta, ci si lasciava 
alle spalle. Gli spettatori interessati si affrettarono - un po’ 
troppo - ad assumere che i linguisti semplicemente non 
fossero in grado di decidersi, che stessero annaspando 
nella confusione, che non avessero una mappa che 
indicasse la direzione da seguire. 

In realtà, i cambiamenti all’interno della teoria generativa 
erano di quel genere che ci si aspetta di trovare in qualsiasi 
scienza in forte ascesa. Se non c’era una mappa, era perché 
quello che si andava esplorando era un territorio del tutto 
nuovo. Coloro che si trovavano in prima linea sul fronte 
della scoperta non potevano che seguire il proprio intuito e 
fare quella che sembrava la mossa migliore. Inoltre, non c’è 
dubbio che la teoria generativa attraesse alcune delle 
menti scientifiche più sveglie e incisive. Resta il fatto 
indiscutibile, per quanto (per taluni) sconveniente, che la 
maggior parte delle nostre conoscenze in materia di 
sintassi sia stata acquisita sviluppando la teoria generativa. 


Per comprendere le ragioni ultime del fallimento della 
grammatica generativa come teoria esplicativa della 
linguistica, e per capire cosa tale teoria avrebbe invece 
dovuto fare per avere successo, dobbiamo capire come la 
teoria generativa si sia evoluta nel corso degli anni, perché 
abbia preso certe decisioni e come le cose sarebbero potute 
andare diversamente, se se ne fossero prese altre. Ecco, 
dunque, una breve storia del movimento. 


LE TRE FASI DELLA GRAMMATICA GENERATIVA 


La grammatica generativa ha avuto diversi avatar, 
ciascuno con il proprio nome, ma la sua storia si divide di 
fatto in tre fasi chiaramente definite. Ognuna di esse 
comincia da alcune assunzioni che sul momento 
sembravano incredibilmente semplici e lineari, ma che, con 
il passare degli anni, portavano a risultati sempre più 
complessi, fino a raggiungere un punto in cui le 
complicazioni divenivano tali da rendere la teoria 
macrocefala. Cosi un nuovo insieme di assunzioni, 
all'apparenza più semplici e lineari, rimpiazzava quello 
precedente. 

Un compendio così breve può fornire solo alcuni utili 
segnavia, la realtà era ben più ingarbugliata. Per un verso, 
ogni volta che si verificava una svolta di rilievo, alcuni dei 
seguaci della fase precedente facevano atto di apostasia - 
taluni solo in privato, altri anche in pubblico - e 
continuavano a lavorare all’interno del paradigma 
precedente oppure prendevano una nuova direzione di 
ricerca. Per l’altro, le pratiche di analisi che non erano 
apertamente condannate dalla nuova fase tendevano a 
persistere nelle fasi successive - fossero o meno 
appropriate e coerenti con la nuova fase (e nella Fase 3, 
anche l’aperta condanna non bastò a fermarle). Infine, le 
transizioni fra le diverse fasi si protrassero a lungo: se 


dovessimo datare l’inizio della Fase 2 a partire dalle sue 
prime avvisaglie, il periodo della transizione dalla Fase 1 
alla 2 verrebbe a essere più lungo della Fase 1 stessa. Di 
seguito vengono riportate solo delle date approssimative, e 
le date finali delle varie fasi intendono semplicemente 
segnalare il momento in cui la nuova fase era ormai ben 
consolidata. 

Prima di iniziare questo resoconto, però, va chiarita una 
cosa: contrariamente a quanto sostenuto dalla maggior 
parte dei suoi detrattori, i cambiamenti apparenti nella 
natura della grammatica generativa erano ampiamente 
motivati, miravano allo stesso obiettivo finale e portavano a 
un complessivo aumento della nostra comprensione e della 
nostra conoscenza della sintassi. Quelli che a molti 
sembravano dei passi falsi, come Newmeyer (1993) ha fatto 
notare, spesso erano il frutto della tensione tra 
adeguatezza descrittiva e adeguatezza esplicativa. 

Una grammatica ideale avrebbe dovuto essere adeguata 
sia da un punto di vista descrittivo sia da un punto di vista 
esplicativo; avrebbe cioè dovuto combinare una descrizione 
completa di tutte le strutture sintattiche presenti in una 
data lingua con la spiegazione del perché esse fossero 
proprio quelle e non altre (preferibilmente, in termini di un 
principio generale piuttosto che in termini di una qualche 
contingenza storica). Ma questo ideale può essere 
irraggiungibile. Per dirla con Sapir (1921, p. 38): «Tutte le 
grammatiche hanno delle falle». Le grammatiche dei 
diversi dialetti dell'inglese si contraddirebbero. Persino le 
grammatiche di singoli parlanti dello stesso dialetto spesso 
risulterebbero incompatibili. Una grammatica descrittiva 
completamente adeguata non sarebbe altro che la lista di 
queste discrepanze; proprio come la mappa mitica del 
mondo di Borges (1975), essa sarebbe tanto grande (e non 
informativa) quanto ciò che descrive. 

Fin da principio, i generativisti si sono mostrati 
interessati più alla spiegazione che alla descrizione (come 


tutti coloro che fanno ricerca scientifica) e hanno creduto, 
al pari dei ricercatori che lavorano in scienze più «dure», 
che la spiegazione comporti la scoperta di generalizzazioni 
applicabili a un’ampia varietà di casi in apparenza diversi. 
In altri termini, credevano che il linguaggio, al pari di altri 
fenomeni, avesse delle leggi. (Se non si crede che la natura 
segua delle leggi, per quale ragione si fa scienza?). 
Tuttavia, per dare avvio a un tale programma si trattava di 
partire dai fenomeni che sembravano più facili da spiegare, 
per poi affrontare quelli più difficili. Inevitabilmente, 
questo ha comportato la temporanea perdita della 
copertura empirica di alcune cose che un approccio più 
descrittivo avrebbe invece preso in considerazione. Molti 
dentro e fuori dalla linguistica si sono lamentati per questo. 
Ma tali critiche mostravano soltanto che costoro non 
sapevano come funziona la scienza. 


LA TEORIA STANDARD (1957-1980) 


In origine, la grammatica generativo-trasformazionale 
(così si chiamava all’inizio) assunse la forma di regole e 
trasformazioni della struttura sintagmatica (SS). Le regole 
SS erano descrizioni delle strutture di base monofrasali in 
termini di categorie astratte quali F (frase), SV (sintagma 
verbale) e SN (sintagma nominale). Di norma, tali categorie 
prendevano la forma di quelle che vennero chiamate 
«regole di riscrittura». Per esempio, F > SN SV voleva dire 
che una frase poteva essere riscritta come (e cioè era 
formata da) un sintagma nominale seguito da un sintagma 
verbale; regole successive avrebbero scomposto in modo 
simile SN e SV nei loro componenti fino a raggiungere il 
livello delle singole parole. Le trasformazioni erano 
processi che assumevano delle regole SS di base e 
trasformavano strutture semplici in strutture più 
complesse, spostando e/o rimpiazzando simboli e/o 


combinando due strutture semplici in una più complessa. 
Perciò, ci sarebbero state delle regole per trasformare le 
frasi enunciative nelle interrogative corrispondenti, quelle 
all’attivo (La polizia ha arrestato Maria) nei loro equivalenti 
al passivo (Maria è stata arrestata dalla polizia), le frasi 
contenenti il dativo (She gave the book to Bill, «Ha dato il 
libro a Guglielmo») in frasi con il doppio accusativo (She 
gave Bill the book): e due frasi con un membro comune 
(L'autista era il fratello di Maria e Hai incontrato l'autista) 
in una sola frase con una subordinata relativa (L'autista che 
hai incontrato era il fratello di Maria). 

L'innovazione più controversa richiesta dalla nuova 
grammatica fu la nozione di movimento. Per esempio, si 
sosteneva che una domanda come Chi ha visto Maria? fosse 
il prodotto di un movimento. Si diceva che chi occupasse in 
origine la posizione di oggetto (post-verbale) all’interno 
della frase «sottostante» Maria ha visto CHI? (cosa che, si 
noti, accade davvero nelle domande che esprimono 
«stupore»). Una domanda normale, quindi, si formava 
muovendo chi all’inizio della frase. 

Tutto questo venne preso alla lettera, persino da alcuni 
linguisti. Naturalmente, si trattava di una metafora, una 
scorciatoia utile a far notare che le due possibili posizioni 
di chi erano in qualche modo strettamente legate. I 
pronomi interrogativi devono apparire all’inizio della frase 
- in inglese e in molte altre lingue, sebbene non in tutte. 
Ma ogni costituente nominale di una frase deve anche 
avere qualche relazione con il verbo - deve riferirsi a chi ha 
compiuto l’azione espressa dal verbo, a chi l’ha esperita o 
subita, a ciò che è stato usato per compierla o a ciò a 
vantaggio di cui quell’azione è stata compiuta, e così via. 
Queste relazioni sono chiamate ruoli tematici (in breve, 
ruoli teta) e includono l’Agente (chi compie l’azione), il 
Tema o Paziente (chi subisce l’azione), lo Strumento (ciò 
che viene usato), e così via. Nella frase Chi ha visto Maria?, 
chi occupa il ruolo di Tema/ Paziente e in inglese quel ruolo 


viene sempre assegnato a quel nome o sintagma nominale 
che segue immediatamente il verbo. Inoltre, alcune 
sottigliezze suggerivano che lo «spazio vuoto» lasciato dal 
«movimento» fosse, di fatto, qualcosa di reale tanto quanto 
tutto il resto. Per esempio, avete mai pensato che, per 
quanto nell’inglese colloquiale sia consentito ridurre want 
to a wanna, questo si può fare in frasi interrogative come 
Who did you want to meet? («Chi volevi incontrare?»), ma 
non in frasi interrogative come Who did you want to meet 
Bill? («Chi volevi che incontrasse Bill?»). 

Dal momento che ho già tirato in ballo molta più sintassi 
di quanta non ne vogliano sentire i lettori, spiegherò meglio 
questo fenomeno in un apposito poscritto a questo capitolo. 
Per il momento, la cosa più importante da notare circa la 
Teoria Standard è che, ai suoi albori, essa non prendeva 
posizione su questioni riguardanti l’innatismo. Il suo atto 
d'apertura, Le strutture della sintassi (Chomsky 1957), era 
poco più che un manuale d’istruzioni, ma la teoria aveva 
delle implicazioni ovvie per quanto riguarda le modalità di 
acquisizione del linguaggio e ciò che potrebbe stare alla 
base dell’acquisizione - implicazioni esplorate da Chomsky 
(1965, e in molti altri lavori seguenti). L'idea che ci fosse 
una componente innata si cristallizzò ben prima della fine 
della Fase 1, anche se fu solo abbozzata. 

Limpulso originario all'ipotesi di una Grammatica 
Universale innata emerse dalla congiunzione di due 
correnti di pensiero la cui unione venne resa esplicita in 
Chomsky (1965). Una risale addirittura a Platone e all’idea 
che l’esperienza non possa essere l’unica fonte della 
conoscenza umana. L'altra risale per lo meno a Humboldt, 
ed è la rapidità con la quale i bambini, a un’età assai 
precoce, già padroneggiano alcune strutture abbastanza 
complesse del linguaggio umano. Lintuizione di Platone era 
stata elaborata all’interno della lunga tradizione della 
filosofia razionalista di cui Chomsky si considerava l'erede. 


L'intuizione di Humboldt, invece, era stata ampiamente 
ignorata. 

La connessione con Platone, da sola, assicurava in pratica 
che l'unione di queste due correnti di pensiero voluta da 
Chomsky venisse espressa in termini mentalistici. Ma ci si 
potrebbe chiedere che cosa, nell'epoca in cui Lorenz e 
Tinbergen stavano sviluppando teorie complesse dell’istinto 
(delle quali, tra l’altro, Chomsky era a conoscenza), lo 
avesse trattenuto per lo meno dal considerare la possibilità 
che il linguaggio non fosse una forma di conoscenza tacita, 
ma piuttosto una forma di comportamento istintivo, che 
assumeva la forma di certe operazioni interne al cervello. 
In parte, il fatto che Chomsky non abbia considerato questa 
possibilità può essere dipeso dall’uso stesso della parola 
comportamento, la quale aveva acquisito delle connotazioni 
di antirazionalismo di matrice skinneriana. Io penso, 
tuttavia, che possa essere intervenuto anche un altro 
fattore: una conseguenza indesiderata che scaturiva da una 
decisione di carattere prettamente metodologico presa 
sulla scorta di quelle che, all’epoca, sembravano le migliori 
ragioni. 

La decisione consisteva nel tracciare una distinzione 
netta tra competenza ed esecuzione. Oggi tale distinzione 
sembra scomparsa insieme alla struttura profonda e 
superficiale e a molti altri concetti che, per decenni, sono 
sembrati parti indispensabili della grammatica generativa. 
Di certo, l'imponente e onnicomprensiva MIT encyclopedia 
of the cognitive sciences (Wilson e Keil 2001) non contiene 
alcuna voce su quella distinzione (mentre è stato dedicato 
un articolo specifico a moltissimi aspetti meno rilevanti 
della grammatica generativa). In verità la distinzione tra 
competenza ed esecuzione ha giocato un ruolo decisivo nel 
determinare la metodologia generativa. 

Se c’era un'innovazione metodologica che aveva reso 
possibile la grammatica generativa, consisteva nell'aver 
colto che una grammatica seria non si sarebbe potuta 


stilare solo sulla base delle frasi effettivamente proferite da 
parlanti madrelingua. Le precedenti analisi della struttura 
della frase avevano assunto che tali frasi rappresentassero 
l’unico materiale su cui una grammatica dovesse basarsi. A 
parte le questioni assai discusse circa gli «errori di 
esecuzione» - il fatto cioè che tale materiale contenesse 
sempre frammenti di frasi, interruzioni, lapsus e altri dati 
che non si vogliono includere in una grammatica -, 
qualsiasi grammatica redatta su queste basi non sarebbe 
stata che una mera raccolta di descrizioni dei tipi di 
costruzioni ammissibili. Di conseguenza, non avrebbe 
potuto aspirare a raggiungere l’obiettivo finale 
dell'adeguatezza esplicativa. 

A tale fine, andava descritto non soltanto ciò che i 
parlanti potevano dire, ma anche quello che non potevano 
dire. Solo comparando frasi che i parlanti madrelingua 
accettavano come grammaticali con frasi apparentemente 
simili ma non accettate come tali (marcate per convenzione 
con un asterisco) si poté arrivare ad abbozzare una prima 
risposta alla domanda sul perché. E la risposta fu questa: 
nel creare frasi, i parlanti seguono delle regole altamente 
specifiche, per quanto del tutto implicite. Tali regole 
potevano essere comprese al meglio solo fornendo i 
dettagli sia delle strutture che quei parlanti non potevano 
generare sia di quelle che potevano generare, e 
specificando quali fattori le rendessero diverse - e in molti 
casi si trattava di vere e proprie sottigliezze. (Si veda il 
poscritto a questo capitolo). Utilizzata a tal fine, la 
distinzione tra competenza ed esecuzione era uno 
strumento assolutamente utile, anzi, indispensabile. 

Si noti che l’esistenza di tali regole implicite, sebbene non 
basti di per sé a provare l’esistenza di una Grammatica 
Universale (GU) innata, risultava del tutto congruente con 
quest’ultima. Infatti la nozione di GU forniva una 
spiegazione senza la quale tali regole risultavano pressoché 
impossibili da comprendere. Eppure, anche le distinzioni 


più utili possono avere delle conseguenze indesiderate. 
Chomsky fece della competenza, più che dell’esecuzione, il 
fulcro della ricerca. In effetti, difficilmente una teoria 
dell'esecuzione poteva venire alla luce prima che fosse 
stata raggiunta una conoscenza esatta di ciò che veniva 
eseguito. Ma, visto che la teoria della competenza era in 
costante ampliamento, una teoria dell'esecuzione - 
esecuzione di ogni genere, in ogni senso - veniva 
continuamente rimandata. 

Tale rinvio significò che nessuno dovesse mai esplicitare 
che cosa si intendesse con essa. L'esecuzione comprendeva 
certamente l’uso del linguaggio, le circostanze nelle quali 
(e gli scopi per cui) le frasi venivano prodotte in date 
occasioni concrete. A ragione, l’uso del linguaggio non 
venne preso in considerazione. Ma che dire di tutta quella 
serie di azioni che il cervello deve compiere ogni volta che 
proferiamo una frase? Contavano anch’esse come 
esecuzione? Data l'ignoranza pressoché totale su come il 
cervello produca il linguaggio, non parve molto sensato 
occuparsi di problemi di questo tipo. Tuttavia, come un 
generativista ebbe a osservare una volta: «La descrizione 
linguistica e le procedure per produrre e riconoscere le 
frasi devono corrispondere a certi meccanismi indipendenti 
che hanno luogo nel cervello» (Katz 1964, p. 133, corsivo 
mio). 

Purtroppo, sembra che nessuno abbia pensato alla 
domanda immediatamente successiva: se dei meccanismi 
indipendenti riconoscono e producono frasi, che motivo c’è 
di ipotizzare un livello superiore di conoscenza astratta? 
Che cosa fa quel livello che non sia già stato fatto? Si 
ricordi, comunque, che negli anni sessanta e settanta i 
riflettori erano puntati sulla psicologia piuttosto che sulla 
realtà neurologica sottostante - ci si concentrava sulla 
mente piuttosto che sul cervello, sulle operazioni di tipo 
cognitivo piuttosto che su quelle di natura elettrochimica 
(nonostante si stesse cominciando a comprendere che 


queste coppie di termini potevano ben riferirsi ad aspetti 
diversi di una stessa cosa). La ragione di tutto ciò era senza 
dubbio lo stato degli studi sulle connessioni tra cervello e 
linguaggio, di cui ci si puo rendere conto davvero soltanto 
leggendo gli articoli apparsi in quegli anni su riviste, come 
Brain (1961): ci sono interi paragrafi sui meccanismi 
locutivi e l’afasia, ma l’unico riferimento alla sintassi è una 
fugace menzione del «difficile problema dell’ordine seriale» 
(p. 437), senza alcun tentativo non soltanto di risolverlo, 
ma anche di formularlo. Prima dell'avvento delle tecniche 
di brain imaging, non era concepibile l’idea che il flusso 
neurale fosse responsabile della costruzione di frasi in 
tempo reale; la «realtà psicologica» era l’unica alternativa 
possibile. 

Il tentativo più serio di connettere grammatica generativa 
e operazioni neurali fu la teoria derivazionale della 
complessità (Miller 1962). Questa teoria avanzava una 
proposta iniziale semplice e apparentemente ragionevole. 
Se le trasformazioni grammaticali (il perno di questa prima 
fase) consistevano in operazioni effettive che un individuo 
doveva eseguire per produrre e comprendere delle frasi, le 
frasi con più trasformazioni avrebbero dovuto essere più 
difficili da produrre di quelle con meno trasformazioni. 
Perciò, a parità di condizioni, le frasi con più trasformazioni 
avrebbero dovuto richiedere più tempo per essere 
elaborate e apparire in stadi di acquisizione più tardi. 
Questo era un chiaro esempio di affermazione testabile sul 
piano empirico. Sfortunatamente, «legare una coda 
psicologica all’aquilone della sintassi» (Miller 1975, p. 204) 
condusse a risultati quantomeno equivoci (Fodor e Garrett 
1967; Brown e Hanlon 1970) - il che non sorprende, 
considerando il fatto che le trasformazioni stesse sarebbero 
state abbandonate dai generativisti di lì a poco. Ma il 
fallimento di questo approccio contribuì a stornare 
l'interesse di molti ricercatori dai tentativi di integrazione 
con discipline contigue. Da quel momento in avanti, essi 


non avrebbero «considerato nessun altro tipo di dati se non 
le intuizioni linguistiche primarie» (Pylyshyn 1973). 

Nella prima fase della grammatica generativa, le 
conseguenze di questa ingiunzione auto-revisionista non 
furono significative. Sembrava abbastanza ragionevole 
sostenere che le conoscenze sul cervello fossero troppo 
poche e troppo congetturali per influenzare la natura delle 
grammatiche. Inoltre, per un lungo periodo durante questa 
prima fase, le assunzioni dei grammatici e le strutture della 
grammatica stessa cambiavano troppo in fretta e in misura 
troppo ampia perché qualcuno potesse dire esattamente di 
che genere fosse la conoscenza della grammatica. Tuttavia 
la natura ultima della componente innata sembrava già 
chiara. Chomsky (1968, p. 65 [trad. it. p. 115]) dichiarava 
che «il vero problema del domani è quello di scoprire 
un'assunzione relativa alla struttura innata 
sufficientemente ricca, e non quello di trovare 
un'assunzione sufficientemente semplice o elementare da 
essere “plausibile”». E, di nuovo, egli fu molto chiaro sul 
fatto che, in ogni ricerca neurologica, il neurologo debba 
avere la parte del secondo violino e accettare, senza 
metterla in discussione, la guida del linguista: «... le 
scoperte della linguistica-psicologia aprono il campo per 
ulteriori ricerche sui meccanismi del cervello, ricerche che 
devono procedere alla cieca, senza sapere cosa si sta 
cercando, se condotte in assenza di questo tipo di 
comprensione dei fenomeni, espressa ad un livello 
astratto» (Chomsky 1988, p. 7 [trad. it. p. 9]). È il carro 
della linguistica a trascinare il cavallo della neurologia - 
per quanto, nella vita reale, sia il cavallo a fare tutto il 
lavoro e il linguaggio sia solo una parte di quel lavoro. 

Tuttavia, proprio nel momento in cui accadeva tutto 
questo, la teoria veniva a trovarsi in guai seri. Dovevano 
esserci più regole di quante non ci si aspettasse - decine, 
se non centinaia, soltanto per l'inglese. Queste regole, 
inoltre, dovevano essere applicate in un determinato 


ordine, dal momento che l’output di una regola X doveva 
formare parte dell’input per un’altra regola Y. Purtroppo, 
spesso accadeva che ci fossero ragioni ineccepibili per 
porre X prima di Y, ma anche ragioni altrettanto 
ineccepibili per mettere Y prima di X. E la proliferazione di 
regole e «paradossi di ordinamento» erano solo due dei 
molti problemi che condussero, alla fine, a rimpiazzare la 
Teoria Standard. 


PRINCÌPI E PARAMETRI (1981-1994) 


La teoria che alla fine emerse dalla lunga transizione 
dalla Fase 1 alla Fase 2 rappresentò una decisa svolta nella 
direzione di anteporre l'adeguatezza esplicativa 
all’adeguatezza descrittiva ed ebbe la propria origine in 
una tesi di dottorato molto influente (Ross 1967), che 
proponeva pochi princìpi generali cui ricondurre molte 
regole particolari legate alla costruzione. Dopo un parto 
molto difficoltoso (descritto da Harris 1993), emerse infine 
una teoria dalle maglie molto strette e onnicomprensiva 
che divideva la sintassi in una mezza dozzina di sotto- 
teoremi inerenti a cose come il Legamento (e cioè la 
determinazione del riferimento di termini come i pronomi, i 
quali, a differenza dei nomi propri, non includono fin 
dall’inizio il proprio riferimento) o la Teoria Tematica (e 
cioè quella che si occupa dei ruoli semantici dei 
componenti delle frasi: Agente, Tema, Paziente, Strumento, 
ecc.). I princìpi di questi sotto-teoremi dovevano essere 
validi in tutti i casi (cioè senza eccezione) per tutte le 
lingue (cioè universali) ed erano estremamente astratti. Per 
esempio, il Principio della Categoria Vuota asseriva che 
tutte le posizioni dalle quali un termine era stato mosso - 
come il termine indicato da v in Che cosa vuole Giovanni v, 
frase che si supponeva derivasse da Giovanni vuole che 
cosa - dovessero essere governate in maniera appropriata. 


Per capire che cosa questo voglia dire, si deve 
comprendere il significato di «governo» - il che, a sua 
volta, richiede la comprensione di una relazione strutturale 
nota come c-comando. Questo rende l’idea di quanto la 
discussione negli studi di sintassi fosse diventata interna 
alla teoria - e di quanto fosse guidata da sviluppi interni 
alla teoria stessa piuttosto che dall’analisi dei dati empirici. 
Questo, di per sé, non è un male - ciò che troviamo nella 
fisica sub-atomica è ben lungi dall’essere la «realtà» che 
percepiamo -, ma porta con sé una gran quantità di 
problemi, tra cui quello che certe assunzioni possono 
basarsi su altre assunzioni, che a loro volta si basano su 
altre assunzioni, una o più delle quali può non essere 
supportata da evidenze sufficienti. 

I princìpi si occupavano di caratteristiche presunte 
universali, ma tralasciavano molte delle cose che variano 
nelle diverse lingue. Che fare di queste ultime? Per 
comprendere la natura del problema che i generativisti 
avevano di fronte in questa fase, dobbiamo concentrarci su 
una potenziale ambiguità contenuta nella parola universale. 

Un senso ovvio di «grammatica universale» è quello di 
una grammatica che, in quanto specie-specifica e quindi 
presumibilmente parte del genoma umano, è comune a tutti 
gli esseri umani, a prescindere dalla particolare lingua che 
parlano. Ma c’è un altro senso possibile di «universale» che 
è in gioco qui. Se una tale grammatica deve essere una 
caratteristica comune a tutti i parlanti di tutte le lingue, e 
se di fatto essa è un mezzo per acquisire la lingua - senza il 
quale, presumibilmente, nessuna lingua potrebbe essere 
appresa -, allora deve essere in grado di generare allo 
stesso modo ciascuna delle migliaia di lingue parlate nel 
mondo. Di conseguenza, la GU dovrebbe essere in grado di 
rendere conto di tutti i modi in cui le lingue si sono 
differenziate tra loro, mostrando anche, allo stesso tempo, 
sotto quali rispetti esse siano la stessa cosa. È universale 
nel senso che deve rendere conto di tutte le forme di 


grammatica riscontrate nel linguaggio umano. 
Nell’introduzione a Lectures on government and binding 
(1981), Chomsky accenna di sfuggita alla distinzione tra un 
«centro» della grammatica (del quale la GU deve rendere 
conto) e una sua «periferia», fatta di costruzioni peculiari 
(delle quali, si presume, essa non deve rendere conto). Ma 
questa distinzione non è mai stata formalizzata, né è mai 
stata formulata in maniera esplicita. Per ragioni di ordine 
pratico, le costruzioni che variano a seconda delle lingue 
sono state trattate in genere come se fossero parte del 
centro della grammatica. 

I mezzi scelti per trattare le costruzioni variabili 
consistevano in quelli che venivano descritti come dei 
«parametri» - degli spazi di variazioni possibili in certi 
punti particolari della struttura delle frasi. I bambini 
potevano allora impostare un certo parametro sulla base 
dell'esperienza; nel migliore dei casi, i parametri si 
presentavano con due sole possibili impostazioni, proprio 
come gli interruttori della luce. Si consideri il cosiddetto 
parametro Pro-Drop o Soggetto nullo. In inglese, e in lingue 
simili, i pronomi personali soggetto non possono non essere 
esplicitati in una frase: vanno inseriti, anche se non hanno 
un preciso riferimento - come accade per esempio in 
inglese a it in It is raining («Sta piovendo»). In spagnolo si 
dice solo Llueve - l'equivalente letterale di rains in inglese. 
Se aggiungeste un pronome, *il llueve, qualsiasi parlante 
madrelingua vi guarderebbe come se foste dei pazzi - e 
infatti i pronomi soggetto compaiono di rado in spagnolo, a 
meno che non servano per dare enfasi o per disambiguare. 
Talvolta il parametro è solo una questione di direzionalità, 
come quello della Direzionalità della Testa, il quale 
determina se una testa (in genere, un nome o un verbo) 
precede o segue il proprio modificatore. 

Parallelamente a questi sviluppi, la componente 
trasformativa, che era molto ampia nella Teoria Standard, 
si ridusse a una regola sola, «Muovi alfa», che significa: 


muovi qualsiasi cosa in qualsiasi posizione. Ma questa, che 
appariva come la strada verso l’anarchia sintattica, era di 
fatto vincolata in maniera molto stringente da alcuni 
princìpi, così da limitare in maniera significativa il 
movimento in qualsiasi posizione. Comunque, la povertà di 
concetti per quanto concerne la componente trasformativa 
era ampiamente compensata dalla proliferazione 
concettuale presente nelle altre componenti. In generale, 
rispetto a quanto accadeva nella Teoria Standard, 
all’interno della teoria dei princìpi e dei parametri (P&P) la 
componente innata era cresciuta a dismisura per 
dimensione, complessità e specificità in virtù della 
convinzione di Chomsky (1986, p. 55 [trad. it. p. 66]) che «i 
meccanismi disponibili devono essere ricchi e 
sufficientemente differenziati per render conto dei 
fenomeni che appaiono nelle lingue umane possibili». 

L'idea dei parametri e del loro ruolo nella sintassi sembrò 
un filone molto ricco a coloro che studiavano l’acquisizione 
della lingua; di conseguenza ci fu un'esplosione degli studi 
di acquisizione della lingua condotti all’interno del 
framework teorico P&P (per esempio, Grimshaw 1981; 
Valian 1981, 1986; White 1985; Hyams 1986). Ora i 
ricercatori avevano proposte molto più specifiche da 
testare e potevano farlo in molte lingue diverse a partire da 
una prospettiva comparativa. In effetti, l’attrattività della 
P&P per gli studiosi di acquisizione della lingua fu tale che 
essa proseguì ancora per più di un decennio e mezzo dopo 
l'emergere della Fase 3 - la quale muoveva da assunzioni 
molto differenti, che, almeno secondo una certa visione, 
avrebbero dovuto rendere illegittimo questo tipo di studi 
(Longa e Lorenzo 2008). Tuttavia, a trent'anni dalla prima 
formulazione della teoria P&P ancora manca una lista 
provvisoria di quanti parametri preveda. Dopo vent'anni, 
Baker (2001) ne stimò «tra i 10 e i 20». Quattro anni più 
tardi, Roberts e Holmberg (2005) li hanno portati a un 


numero compreso «tra i 50 e i 100» - una stima che loro 
stessi definiscono «prudente». 

Con un’intuizione quasi profetica, Newmeyer (1996, pp. 
64-65) propose la seguente osservazione: «Lo scenario 
peggiore è che una ricerca sulle proprietà di centinaia di 
lingue parlate in diverse zone del mondo aumenti la 
quantità di variazione dei parametri che è stata postulata 
tra le varie lingue; e il numero di impostazioni possibili per 
ogni parametro potrebbe aumentare al punto che lo stesso 
termine “parametro” potrebbe rischiare di diventare 
nient'altro che un’espressione tecnica per indicare una 
regola di una particolare lingua». Questo fu precisamente 
ciò che accadde nel decennio successivo. Venne fuori che 
molti dei parametri già introdotti non rispettavano la 
limitazione a impostazioni binarie. In molte lingue, la 
posizione delle teste in relazione ai propri modificatori 
variava in accordo con le classi di parole a cui questi 
appartenevano; per fare solo un esempio, in inglese gli 
aggettivi precedono i nomi, mentre i sintagmi 
preposizionali che li modificano li seguono. Più parametri 
venivano ipotizzati, più collocazioni dovevano essere 
permesse, più affioravano i contro-esempi. Alcuni erano già 
evidenti anche prima della profezia di Newmeyer; con 
l'andare del tempo ne emersero sempre più (si vedano, tra 
gli altri, Newmeyer 2004, 2005; Haspelmath 2008; 
McWhorter 2008). In seguito, l’idea di parametro fu 
abbandonata anche da figure centrali della grammatica 
generativa come Boeckx (2010). 

Ma al di là delle carenze sul piano empirico, il carico che 
veniva posto sulle spalle della GU stava diventando troppo 
pesante in termini sia quantitativi sia qualitativi. Per 
esempio, si doveva assumere la «teoria del legamento» solo 
come una piccola parte di quella conoscenza. La teoria del 
legamento comprendeva la relazione tra i diversi tipi di 
pronomi e i loro referenti e spiegava (in aggiunta ad altre 
cose simili) perché quando si dice Susan washed her 


(«Susanna l’ha lavata»), her non può riferirsi a Susan, 
mentre può farlo in frasi come Her sister washed Susan 
(«Susanna è stata lavata da sua sorella») - anche se in 
Susan made her sister wash herself («Susanna ha fatto sì 
che sua sorella si lavasse») herself non può riferirsi a Susan 
ma alla sorella di lei. Stando alla formulazione originaria 
(Chomsky 1981, pp. 184-85), un costituente non poteva 
legarsi (vale a dire avere un proprio referente determinato) 
al di fuori della propria «categoria di governo». Per 
comprendere la nozione di «categoria di governo», bisogna 
comprendere altri due concetti astratti, «categoria 
minima» e «governatore», e tutti questi concetti astratti 
dovevano essere presi in considerazione prima di poter 
determinare in quale modo questi tre «princìpi del 
legamento» si applicassero a ogni caso specifico. La 
conoscenza di tutte queste condizioni, categorie e princìpi 
era solo una piccola parte di ciò che, sulla base della teoria 
P&P andava attribuito alla componente innata e, quindi, 
alle menti dei bambini che non hanno ancora appreso 
nessuna lingua. 

Se qualcuno avesse chiesto a Chomsky, o a qualunque 
altro generativista, come esattamente un tipo di 
conoscenza con un tale livello di astrazione e specificità 
rispetto a una lingua potesse trovarsi nella mente/cervello, 
la risposta probabilmente sarebbe stata simile a quella che 
si trova in Chomsky (1986, p. 26 [trad. it. p. 37]): «Lo stato 
stazionario di conoscenza acquisito [lingua I] e lo stato 
iniziale Sg sono elementi reali di menti/cervelli particolari, 


aspetti del mondo fisico, nel quale consideriamo gli stati 
mentali e le rappresentazioni codificati fisicamente in 
qualche maniera» (corsivo nell’originale). In altre parole, 
devono essere (in qualche modo) parte delle operazioni 
compiute dal cervello, anche se spetta poi alla neurologia il 
compito di spiegare come. 


La teoria P&P ha avuto un’ottima funzione euristica, 
rivelando sul linguaggio molte cose di cui ogni teoria futura 
avrebbe dovuto tener conto. Tuttavia, anche all’apice della 
sua fioritura, persino Chomsky si trovò sul punto di 
rigettare molte delle assunzioni su cui essa si basava. 


IL PROGRAMMA MINIMALISTA (DAL 1995 A OGGI) 


Bisogna ricordare che, come Chomsky stesso ha più volte 
ribadito, il Programma Minimalista (PM) è precisamente 
questo: un programma, un modo di approcciare il 
linguaggio, e non una teoria esplicita - e ci potrebbero 
essere molti modi diversi di realizzarlo. La motivazione 
principale per la sua adozione fu che Chomsky (1995, p. 
233) si rese conto che le assunzioni fatte dalle versioni 
precedenti della grammatica generativa troppo spesso 
avevano «pressoché il medesimo ordine di complessità di 
ciò che spiegavano». La risposta fu ridurre la grammatica 
alla «necessità concettuale virtuale», il numero minimo di 
elementi che potrebbero essere sufficienti per derivare le 
frasi. Quel numero veniva specificato così: «Gli elementi già 
presenti negli oggetti lessicali» scelti per una frase data, ai 
quali «non venivano aggiunti nuovi oggetti ... ad eccezione 
della risistemazione delle proprietà lessicali» (p. 228). 

La maggior parte dei princìpi e dei processi sottostanti 
alla teoria P&P non rientravano però tra questi elementi. 
Tra essi vi erano «la D-struttura, la S-struttura, il governo, 
il Principio di Proiezione e il Criterio Teta, le altre 
condizioni che si sosteneva si applicassero alla D-struttura 
e alla S-struttura, il Principio della Categoria Vuota, la 
Teoria X-barra in generale, l'operazione Muovi-Alfa, 
l'ipotesi dell’Infinito Scisso, e altre» (Chomsky 1995, p. 10) 
così come «la Teoria del Legamento, la Teoria dei Casi, la 
Condizione della Catena, e così via ... Non ci dovrebbero 
essere governo, proprietà stipulate delle catene, relazioni 


del legamento interne al linguaggio, interazioni di altro tipo 

. categorie di sintagmi o livelli della barra; quindi non ci 
dovrebbe essere neppure una Teoria X-barra o altre teorie 
della struttura dei sintagmi, a parte la Teoria della Bare 
Phrase Structure» (Chomsky 2000, p. 113). Le proprietà 
che non potevano essere dedotte da quelle 
«concettualmente necessarie» andavano semplicemente 
eliminate. Ciò che rimaneva della sintassi vera e propria 
erano solo due componenti. Uno era il Merge, un processo 
che prende due oggetti sintattici qualsiasi (parole, 
sintagmi, clausole subordinate, ecc.) e li combina per 
formare un nuovo oggetto sintattico. A impedire che tutto 
si potesse unire con tutto fu il vincolo che il prodotto finale 
del processo risultasse interpretabile a livello delle due 
«interfacce» con gli altri componenti necessari del 
linguaggio: suono e significato (o, per dirla con Chomsky, 
SM, il sistema sensomotorio, e CI, il sistema Concettuale- 
Intenzionale, prima conosciuto come Forma Logica). L'unico 
altro componente era Muovi (già discusso); e la speranza 
era che Muovi potesse essere fuso con il Merge trattandolo 
come Re-merge - il processo che applicava il Merge a una 
copia di qualcosa a cui il Merge era già stato applicato una 
volta. 

A livello di concezione, il PM era splendido. Per quanto 
riguarda i suoi effetti, però, fu sconcertante. La liberà 
fornita dal fatto che il PM fosse un programma e potesse 
essere sviluppato in molti modi consentì agli studiosi di 
sintassi di conservare alcune caratteristiche della teoria 
P&P e anche di quelle precedenti, se apparivano 
indispensabili. Ma sebbene almeno alcune analisi 
sintattiche provassero a aderire alle intenzioni di base del 
PM, il suo impatto sugli studi di acquisizione ed evoluzione 
fu (non per fare una battuta) minimo. 

I generativisti che studiano l’acquisizione della lingua 
hanno ampiamente ignorato il PM, continuando a usare un 
approccio in termini di parametri e impostazioni, anche se i 


parametri non avevano un ruolo preciso all’interno del 
nuovo framework (Longa e Lorenzo 2008). Al contrario, 
sebbene si suggerisse (Golumbia 2010) che il PM fosse 
stato motivato da certe preoccupazioni riguardanti 
l'evoluzione, ne scaturirono delle proposte evoluzioniste 
(Hauser et al. 2002; Chomsky 2010) che riuscirono ad 
allontanare sia i linguisti sia i biologi - i linguisti per via di 
un'attenzione eccessiva nei confronti di specie prive di 
linguaggio, i biologi per via di assunzioni che pochi (per 
non dire nessuno) tra gli esperti di biologia dell'evoluzione 
avrebbero potuto accettare. Anche in sintassi, i risultati 
sono stati ambigui. Un linguista, che nello handout di un 
corso si sentì di esprimere un'opinione più liberamente di 
quanto non avrebbe fatto in pubblico, confessò con un 
candore raro: «Parlando in termini pratici, ciò che è 
avvenuto è che c’è stato un cambio della prospettiva 
fondamentale su quanto sta accadendo in sintassi, ma 
questo ha avuto pochi effetti sulla vita quotidiana degli 
studiosi di sintassi» (Hagstrom 2001). 

Non sorprende, dunque, che le implicazioni del PM per la 
natura e il contenuto della GU siano state ampiamente 
ignorate. Ma esse sono enormi. Tutto il pesante fardello 
che la componente innata doveva portare con sé, come i 
princìpi menzionati in precedenza, è ora scomparso. Si può 
ridurre, per esempio, il legamento al movimento (Hornstein 
2001) e il movimento si può ridurre al Merge (Koster 2007). 
E poiché si è ipotizzata la possibilità che il Merge sia la sola 
operazione caratteristica del linguaggio - cioè non 
sviluppata per o utilizzata da, sistemi cognitivi -, esso 
diventa potenzialmente il solo contenuto della componente 
innata del linguaggio. 

Questo è quanto, per ciò che concerne i princìpi. Che dire 
dei parametri? Nelle sezioni precedenti abbiamo visto come 
lo scetticismo dei generativisti nei confronti dei parametri 
fosse cresciuto. In ogni caso, da Borer (1984) in poi, in 
molti hanno accettato l'assunzione che i parametri siano 


localizzati a livello lessicale - in particolare, a livello della 
morfologia grammaticale («parole-funzione» e affissi). E la 
morfologia va appresa insieme alle funzioni dei vari 
morfemi grammaticali. Se ritenete che questo sia ovvio, 
considerate le preposizioni semplici di luogo come in (in), 
at (a) on (su) e cosi via e i loro «equivalenti» in spagnolo o 
in olandese (per non spingerci troppo pit in la dell’Europa): 
ci sono davvero poche corrispondenze esatte (sempre che 
ce ne sia qualcuna) e le funzioni di un certo elemento in 
una lingua possono essere realizzate da due o più elementi 
in un’altra, o viceversa. Sembra altamente improbabile che 
tutte queste proprietà specifiche delle lingue particolari 
siano in qualche modo pre-programmate nel bambino. Al 
massimo, ci potrebbe essere un insieme semantico di 
possibili locazioni (sopra-sotto, dentrofuori, ecc.), che il 
bambino deve poi far corrispondere a qualsiasi insieme di 
preposizioni di luogo una certa lingua gli metta a 
disposizione - un compito oneroso, ma che non eccede le 
possibilità delle comuni risorse di apprendimento. 

Nella decennale battaglia contro l’empirismo, iniziata con 
il suo attacco distruttivo alla linguistica comportamentista 
(Chomsky 1959), Chomsky ha insistito a lungo sul fatto che 
le risorse innate per il linguaggio debbano essere compito- 
specifiche e interamente distinte dai meccanismi legati a 
scopi più generali - i quali erano, secondo gli empiristi, ciò 
che rendeva possibile l'apprendimento della lingua per i 
bambini. Oggi, pur senza ammetterlo esplicitamente, egli 
sembra aver abbandonato gran parte di queste idee. Ma 
potrebbe essere, allora, che ormai nulla (oltre al Merge) 
distingua il generativismo dall’empirismo? 


MINIMALISMO ED EMPIRISMO 


Sebbene il PM circoli ormai da un paio di decenni, la 
comunità degli scienziati cognitivi deve ancora 


comprendere alcune delle sue implicazioni piu generali. Ho 
trovato solo tre discussioni sulle relazioni tra PM ed 
empirismo, tutte piuttosto recenti - una condotta da un 
linguista generativista di lungo corso (Hornstein 2009), le 
altre due portate avanti da studiosi relativamente poco 
conosciuti (Collins 2010; Golumbia 2010). 

Collins (2010, p. 2) cita un passo di Chomsky (1965, p. 
58): «Il tentativo empirista di mostrare come le assunzioni 
circa un dispositivo di acquisizione della lingua possano 
essere ridotte a una quantità minima di concetti è fuori 
bersaglio» (il corsivo è di Collins). Dal momento che 
«ridurre» il dispositivo di acquisizione della lingua (il che 
equivale a dire la GU o la componente innata) «a una 
quantità minima di concetti» è l’obiettivo principale del 
PM, Collins (2010, p. 5) conclude: «Curiosamente, sembra 
che il minimalismo proponga un programma empirista». 

Collins prova a sollevare Chomsky da questa accusa 
sostenendo che, mentre la parte della componente innata 
dedicata esclusivamente al linguaggio può essere contratta, 
il linguaggio stesso rimane una facoltà complessa e innata. 
Inoltre la «povertà dello stimolo» - il fatto che i dati 
linguistici non siano sufficienti per far arrivare un bambino 
all'elaborazione di una grammatica - rimane valida 
indipendentemente dal fatto che la dotazione del bambino 
sia più o meno ricca, più o meno specifica per una certa 
lingua. Allo stesso modo, Hornstein (2009) sostiene che 
l’obiettivo di Chomsky non è mai stato portare a termine un 
programma innatista, ma piuttosto cercare una soluzione al 
«problema di Platone» - l'insufficienza dell'esperienza per 
render conto di tutta la conoscenza -, ovunque potesse 
essere scovata e senza preoccuparsi delle conseguenze. 
Sebbene il linguaggio, inteso in senso lato, sia riconducibile 
in buona parte, se non del tutto, a facoltà evolutesi per altri 
scopi, tali facoltà rimangono comunque innate, e la 
mente/cervello non è affatto quella tabula rasa di cui 
parlavano gli empiristi. 


Tuttavia queste argomentazioni non colgono nel segno. 
Erano proprio la complessità e l’essere innati dei 
meccanismi compito-specifici per il linguaggio, insieme alla 
loro indipendenza da altre facoltà cognitive, ad avere 
rappresentato per decenni l'essenza del discorso di 
Chomsky, nonché il bersaglio degli attacchi degli empiristi 
contro di lui. Infatti, anni dopo che il PM era venuto alla 
luce, Chomsky (2002, pp. 85-86) continuava a sostenere: «È 
difficile evitare la conclusione che una parte della 
dotazione biologica degli esseri umani sia uno specializzato 
“organo del linguaggio”, la facoltà del linguaggio (FL). Il 
suo stato iniziale è il risultato della genetica e può essere 
comparato allo stato iniziale del sistema visivo umano ... 
Via via che diventa più sostanziale, la discussione 
sull’acquisizione del linguaggio fa assunzioni sull’organo 
del linguaggio che sono sempre più ricche e dominio- 
specifiche, senza eccezioni, per quanto ne so» (corsivo 
mio). Tra la concreta ricerca di Chomsky sulla sintassi e le 
sue assunzioni meta-teoriche c’è insomma una cesura che 
non è stata né risolta né spiegata. 

L'altro articolo in questione, Golumbia (2010), non fa mai 
menzione della «parola che comincia per “e”», accusando 
Chomsky di funzionalismo piuttosto che di empirismo. Ma 
questo è chiaramente un errore. I funzionalisti condividono 
con gli empiristi una certa avversione per l’analisi formale, 
oltre a un forte scetticismo nei confronti di ogni genere di 
meccanismo innato per il linguaggio. Hanno però almeno 
una convinzione che gli empiristi non hanno e che Chomsky 
continua a rigettare con forza: credono che il linguaggio si 
sia evoluto per delle ragioni legate alla comunicazione e 
che abbia assunto una certa forma in ragione di certe 
esigenze comunicative. Il fatto che Golumbia citi Putnam e 
Quine - due empiristi che non hanno mai sposato la 
linguistica funzionalista - come i due pensatori alle cui 
posizioni Chomsky sembra avvicinarsi ora conferma 
ulteriormente come sia l’empirismo, e non il funzionalismo, 


ciò di cui lo stesso Golumbia in verità sta parlando. L'unica 
conclusione che si può trarre è che, nonostante la sua 
posizione sia ancora distante dall’empirismo vero e proprio, 
Chomsky ha comunque (volutamente o meno) ridotto in 
maniera significativa la distanza tra empirismo e innatismo. 


MINIMALISMO E BIOLOGIA 


La creazione del PM è riconducibile, almeno in parte, al 
fatto che Chomsky si era reso conto che il complesso 
modello P&P risultava fondamentalmente incompatibile con 
la biologia evolutiva? Golumbia suggerisce di sì. Ma 
propone un’osservazione ancora più penetrante: «Nel PM 
sembra fuorviante chiamare la GU “sistema”. Si tratta 
piuttosto di un insieme di operazioni» (Golumbia 2010, p. 
40). In altre parole, e senza alcuna intenzione da parte di 
Chomsky, il PM ha condotto la sintassi sensibilmente più 
vicino a quanto si propone in questo libro. 

La chiave qui è il modo in cui viene concepita la GU. Fin 
da principio - e come dimostra il titolo di uno dei suoi libri 
più influenti: La conoscenza del linguaggio (1986) - 
Chomsky ha concepito la GU come «conoscenza». Questo 
ha lasciato insoddisfatti molti filosofi, secondo i quali la 
conoscenza è qualcosa che, quando la si possiede, si sa di 
possederla - e Chomsky (1980, p. 69) fu costretto a coniare 
l’orrendo neologismo cognize per connotare il genere di 
conoscenza che dà luogo alla GU. Tuttavia «qualcuno che 
ha conoscenza nel senso di cognize non può dire ciò che 
conosce [cognizes], non può mostrare l’oggetto della 
propria conoscenza [cognizing], non riconosce ciò che 
conosce [cognizes] quando gli venga detto, non dimentica 
mai ciò che conosce [cognizes] (ma neppure lo ricorda), 
non l’ha mai appreso e non potrebbe insegnarlo. Al di là di 
questo, cognize è proprio come conoscere!» (Bennett e 
Hacker 2007, p. 138). 


Un modo più chiaro di concepire la GU sarebbe 
considerarla un «insieme di operazioni». Dopotutto, e a 
prescindere dal fatto che i meccanismi coinvolti siano 
innati, il cervello deve eseguire una serie di operazioni per 
produrre delle frasi. Di conseguenza, c’è una qualche 
ridondanza se il cervello contiene sia meccanismi autonomi 
neurologici per generare frasi sia un livello di 
«conoscenza» astratta, una grammatica, con un contenuto 
equivalente a quello di quei meccanismi. L'una o l’altra cosa 
è senz'altro superflua; e poiché non è possibile eliminare le 
operazioni fisiche, dovremmo abbandonare la conoscenza 
astratta. Così facendo - e cioè, concependo la GU come il 
risultato di un insieme di operazioni, routine o algoritmi 
eseguiti dal cervello -, mettiamo il linguaggio sullo stesso 
piano di altri processi (per esempio, la digestione, la 
circolazione sanguigna, la visione), del cui modo specifico 
di operare semplicemente non siamo coscienti. 

Vale la pena di prenderci un po’ di tempo per vedere 
come le attuali assunzioni di Chomsky sulle operazioni 
sintattiche possano, in effetti, fungere da ipotesi iniziale sul 
modo in cui davvero il cervello costruisca frasi. 


OPERAZIONI MINIMALISTE 


Dobbiamo innanzitutto comprendere la differenza tra due 
approcci diversi alla descrizione della sintassi: quello 
rappresentazionale e quello derivazionale. Gli approcci di 
tipo rappresentazionale sono top-down. Tutte le forme di 
grammatica generativa che hanno preceduto il PM erano 
rappresentazionali. Cominciavano dalle frasi intere, le 
scomponevano nelle loro componenti (sintagmi e frasi) per 
poi scomporre ulteriormente queste ultime nelle loro 
componenti (le radici delle parole e i morfemi a esse legati 
- dove un morfema è la più piccola unità indipendente del 
significato e un morfema legato è un suffisso o un prefisso, 


come in- o -are, che necessita della radice di una parola a 
cui attaccarsi). Tipicamente, le frasi venivano visualizzate 
in strutture gerarchiche ad albero: una struttura completa 
andava assemblata prima che vi si potessero inserire le 
parole. 

Con l’emergere del PM arrivò la Teoria della Bare Phrase 
Stucture (Chomsky 1994), una procedura di tipo bottom-up 
perfettamente speculare all'approccio rappresentazionale. 
Due parole venivano combinate fra loro dal Merge, una 
terza veniva combinata con l’unità creata dalla prima 
operazione di Merge, e il processo si ripeteva fino a 
raggiungere la struttura completa. L'approccio 
rappresentazionale (Brody 2002) e quello derivazionale 
(Epstein et al. 1998; Seely 2006) coesistono tuttora, non 
senza difficoltà, sotto l’egida del PM. Per via di questa 
specularità che li lega, e per via del fatto che il prodotto 
finale del Merge sia una struttura gerarchica ad albero 
simile a quella da cui parte l'approccio rappresentazionale, 
si potrebbe concludere che i due approcci siano 
semplicemente due varianti notazionali e che non faccia poi 
tanta differenza quale dei due si scelga. 

Le cose stanno effettivamente così laddove si abbia come 
unico interesse quello di esprimere il contenuto di una 
qualche forma di «conoscenza». Tuttavia, se l’obiettivo è 
quello di caratterizzare le operazioni che il cervello 
potrebbe concretamente compiere, allora un modello di 
tipo bottom-up si rivela molto più utile di uno che parta dal 
prodotto finito. Esaminiamo, perciò, nel dettaglio i passaggi 
di una rappresentazione derivazionale, per vedere fino a 
che punto l'analogia regga. L'operazione comincia con la 
Numerazione (Chomsky 1995, pp. 225-28), la quale 
combina tutte le parole da usare nella frase con il numero 
di volte in cui ciascuna di esse deve venire usata. E chiaro 
che il cervello deve (in qualche modo) eseguire 
un’operazione simile. In realta, gli elementi vengono 
probabilmente recuperati in un certo lasso di tempo e non 


tutti nello stesso momento, ma in questo contesto non è un 
problema assumere un’«istantaneita idealizzata». 

Il processo prosegue connettendo le parole in strutture - 
combinando due parole per formare un sintagma, 
combinandone poi una terza per allargare quel sintagma, e 
così via. Chiaramente, anche se l'ordine in cui ciascuna 
coppia di elementi viene congiunta dovesse alla fine 
corrispondere all’ordine lineare della frase nella sua forma 
finale, una frase non verrà costruita in maniera sequenziale 
seguendo l’ordine lineare finale (per esempio, La ragazza ... 
La ragazza ha guardato ... La ragazza ha guardato il suo ... 
La ragazza ha guardato il suo cane). La contiguità spaziale 
non è ciò che determina quanto strette siano le relazioni tra 
parole. Prendete per esempio una frase come The letter I 
sent you should have answered that question («La lettera 
che ti ho mandato avrebbe dovuto rispondere a quella 
domanda»). Le parole should e sent sono entrambe 
direttamente adiacenti a you, e You should have answered 
that question («Avresti dovuto rispondere a quella 
domanda»), nella quale you e should sono strettamente 
connessi, è da sola una frase del tutto grammaticale. 
Quest'ultima, però, ha un significato completamente 
slegato da quello della frase precedente. Nonostante you e 
should siano altrettanto adiacenti, nella prima frase you ha 
una relazione stretta con sent (è l'oggetto di quel verbo) e 
ne ha solo una molto indiretta con should, il cui soggetto 
infatti non è you ma The letter I sent you («La lettera che ti 
ho mandato»). In altri termini, ciò che viene combinato 
prima sono le parole più strettamente connesse l’una 
all'altra, a prescindere dalla loro sequenza lineare finale. Di 
conseguenza, nella frase da cui siamo partiti, il suo si unirà 
prima a cane, poi ha guardato si unirà a il suo cane, poi la a 
ragazza e, solo alla fine, la ragazza a ha guardato il suo 
cane. 

Non sempre il processo appena descritto può continuare 
senza interruzioni finché non si sia costruita tutta la frase. 


Chomsky (1999) ha ipotizzato che le derivazioni procedano 
per «fasi». Quell’articolo è talmente tecnico che, per 
spiegarlo, è servita una postilla più lunga dell’articolo 
stesso (Uriagereka 1999). Di conseguenza, assumiamo (in 
maniera assai semplificata) che una fase sia pressoché 
equivalente a una clausola. Chomsky suggerisce che le fasi, 
una volta completate, diventano impenetrabili: non si 
possono applicare loro ulteriori processi sintattici (eccezion 
fatta, ovviamente, per l’unione con altre fasi per produrre 
frasi complesse contenenti più clausole). Questo aiuterebbe 
a rendere conto dei molto diffusi «effetti-isola» che si 
trovano generalmente in sintassi - e, tra le altre cose, 
spiegherebbe perché (tranne in alcune circostanze molto 
specifiche) in generale i costituenti non possono 
«muoversi» al di fuori delle frasi-isola all’interno delle quali 
sono stati originariamente combinati. 

Di nuovo, s’intravedono delle somiglianze tra l'approccio 
derivazionale alla sintassi e un processo che molto 
probabilmente è utilizzato anche dal cervello stesso. 
Chomsky non dice mai esplicitamente se ritiene che le fasi 
siano prodotte in maniera sequenziale o simultanea, ma 
non c’è bisogno di escludere un processo di elaborazione 
simultaneo - e anzi, abbiamo buone ragioni per supporre 
che esso ci sia. L'idea che il cervello umano sia un grande 
processore che lavora in parallelo (Ballard 1986; Alexander 
e Crutcher 1990; Wassle 2004) è ampiamente condivisa; 
perciò la produzione simultanea di fasi è certamente 
possibile, e la velocità con cui parliamo sembra renderla 
probabile. Anche se non abbiamo stime affidabili della 
lunghezza media delle frasi (qualcosa che probabilmente 
varia molto a seconda del genere di discorso), spesso si 
suggerisce una media di cinquanta parole, per quanto la 
cifra diminuisca di sicuro nella conversazione informale. 
Ma anche una media di cinquanta parole vorrebbe dire 
avere dalle dieci alle dodici frasi al minuto e solo cinque-sei 
secondi per frase. Dato che questo lasso di tempo deve 


includere il recupero delle parole e l’assemblaggio della 
frase, insieme al proferimento, sembra alquanto 
implausibile che il cervello possa mantenere questi ritmi, se 
non assemblasse parti (fasi?) di frasi più lunghe 
simultaneamente e in parallelo. 

A differenza di quanto accade con il modello 
derivazionale, non sembra molto verosimile che il cervello 
impieghi dei meccanismi simili a quelli di una sintassi 
rappresentazionale. Se esistessero, dovrebbero essere in 
grado di creare prima un albero astratto di ogni frase, in 
molti casi grande e complesso. Solo una volta che un tale 
albero fosse costruito, con tutti i suoi nodi e tutti i suoi 
rami, fino ad arrivare al livello dei suoi nodi finali, sarebbe 
possibile recuperare e inserire gli elementi lessicali 
necessari. Questo significherebbe pianificare la struttura di 
una frase nei suoi dettagli prima ancora di sapere che cosa 
si stia per dire. La nostra conoscenza del cervello è così 
scarsa da non permetterci di escludere del tutto una tale 
procedura (di fatto, nessuna procedura), ma difficilmente 
sarà questa la prima opzione da prendere. in 
considerazione, soprattutto se ne abbiamo a disposizione 
una più semplice. 

È probabile che le somiglianze tra una versione 
derivazionale del PM e i presunti processi del cervello siano 
più accidentali che volute. Chomsky non lascia intendere 
alcuna consapevolezza di una tale connessione da parte 
sua, e la corrispondenza tra i processi noti della sintassi e 
ipotetici processi neurali non è mai stata un suo obiettivo 
esplicito. Ma, anche se il grado di somiglianza è fortuito, 
rimane comunque una base su cui formulare proposte che 
vadano più esplicitamente nella direzione di quei processi. 


IL PROBLEMA DI CHOMSKY 


Abbiamo fin qui passato in rassegna mezzo secolo di 
tentativi di risolvere il «problema di Platone», per lo meno 
nella misura in cui quel problema riguarda il linguaggio. 
Dovremmo ora essere in grado di farci un’idea più precisa 
del «problema di Chomsky», consistente nel dare una 
soluzione al problema di Platone che mettesse lo studio del 
linguaggio sullo stesso piano delle altre branche 
dell’indagine scientifica. 

Non si ripetera mai abbastanza che, nonostante tutte le 
critiche che gli sono state rivolte (alcune delle quali dei 
palesi abusi del diritto di critica), il movimento 
generativista ha avuto effetti profondamente benefici per la 
nostra comprensione del linguaggio. È altrettanto vero che 
le svolte della teoria generativa non sono in alcun modo 
sintomo di incertezza circa gli obiettivi da perseguire, ma 
assomigliano piuttosto al lavoro di un artigiano - un 
idraulico, diciamo, che nel tentativo di allentare un giunto 
particolarmente ostico, di tanto in tanto, modifica e 
riaggiusta la propria presa sul tubo. Come suggeriscono 
Hornstein (2009) e Boeckx (2014), il percorso accidentato 
dello sviluppo della teoria generativa può essere stato 
l'unica via praticabile per portare alla luce tutti i fatti 
linguistici di cui un modello definitivo della GU dovrebbe 
rendere conto. Tuttavia, nonostante il successo ottenuto, la 
linguistica generativa rimane curiosamente isolata dagli 
altri campi della scienza. (Anzi, molti forse le negherebbero 
addirittura lo statuto di scienza). 

Questo stato di cose è in parte dovuto a fattori che non 
sono colpa di qualcuno (o di tutti!). I tentativi dei linguisti 
di venire a capo delle complessità della sintassi hanno 
originato un’opacità misteriosa e una pletora di termini 
tecnici che hanno spento gli entusiasmi di tutti tranne i 
ricercatori più dediti alla causa. Mentre dei materiali dello 
stesso grado di complessità di quelli di cui si occupa la 
linguistica vengono regolarmente insegnati nelle scuole 
superiori durante le lezioni di fisica, in pochi hanno un 


qualche tipo di contatto con la linguistica al di fuori dei 
corsi di dottorato. Di conseguenza, i nonlinguisti sono stati 
restii a fare i compiti a casa necessari per poter 
intrattenere un qualsiasi dialogo con i linguisti. 
Naturalmente, dal canto suo, questo ha incoraggiato i 
linguisti stessi ad assumere un atteggiamento del tipo 
«prendere o lasciare», che ha influenzato i tentativi di 
rimediare al loro isolamento. 

Quello che Jenkins (2000) ha descritto come «il problema 
dell’unificazione» è sempre stato ben chiaro a Chomsky 
(1991, p. 6), il quale l’ha formulato così: «Come possiamo 
integrare le risposte a queste domande [che cos’é la 
“conoscenza del linguaggio”, in che modo si è evoluta ed è 
stata acquisita, usata e realizzata nel cervello] all’interno 
delle scienze naturali esistenti, magari anche 
modificandole?» (corsivo mio). Tuttavia, ben lungi dal 
modificare le risposte della linguistica, o anche solo dal 
discutere come esse potrebbero essere integrate al meglio 
con le scoperte delle altre scienze, Jenkins (2000, p. 3) 
respinge indignato ogni discorso sulla «realtà psicologica» 
o sulla «realtà neurologica» delle ipotesi linguistiche e 
dichiara: «La linguistica potrebbe ora suggerire un nucleo 
di proprietà interne della facoltà del linguaggio, che, a sua 
volta, pone domande importanti per la biologia» e «le 
computazioni sintattiche della facoltà del linguaggio sono 
l'evidenza biologica» (corsivo mio). 

Largomentazione standard a favore di questo approccio è 
riassunta brevemente da Smith (2000, p. VIII): 
«L'asserzione secondo cui ciò che è fisico, o fisiologico, 
avrebbe un qualche tipo di priorità è un fraintendimento: le 
teorie della linguistica sono ricche e fanno predizioni 
specifiche in un dominio vasto proprio come fanno le teorie 
della chimica o della biologia. Perciò è altamente 
improbabile che, allo stato attuale della nostra 
comprensione, il tentativo di ridurre la linguistica alla 
neurologia conduca a un qualche risultato apprezzabile». 


Ma questa argomentazione non coglie nel segno. Nessuno 
sta suggerendo che «cio che è fisico, o fisiologico» debba 
avere la priorità sulle teorie della linguistica, ma 
semplicemente che quest’ultima non dovrebbe procedere 
come se il primo non esistesse. Possiamo non sapere molto 
sul cervello, ma sappiamo che, per quanto concerne la 
struttura delle frasi, un modello derivazionale si avvicina al 
genere di cose che il cervello di solito fa più di quanto non 
faccia un modello rappresentazionale. Possiamo non avere 
una comprensione completa dell'evoluzione, ma sappiamo 
che, se c’è una GU di un qualsiasi genere, essa deve essersi 
evoluta; e sappiamo che molto di quanto è stato proposto 
per la GU è alquanto improbabile sia il prodotto 
dell’evoluzione. 

Con il senno di poi, si può vedere dove stia l'errore dei 
generativisti. Fin dai suoi esordi, la grammatica generativa 
è stata afflitta da una profonda incompatibilità interna tra 
gli elementi di novità che portava con sé e quelli più 
tradizionali. Per quanto riguarda le novità, la facoltà del 
linguaggio era concepita come un «organo del linguaggio» 
- qualcosa che, proprio come i polmoni, il cuore o lo 
stomaco, operava in maniera non direttamente visibile alla 
mente razionale e cosciente. Il linguaggio nel singolo 
individuo veniva descritto come qualcosa che «si sviluppa» 
o «cresce», come i peli pubici o i denti del giudizio, e non 
come qualcosa che viene «appreso» o «acquisito». 
Dall’altro lato, il linguaggio veniva invece visto 
tradizionalmente come una parte della «cognizione umana» 
- ée i generativisti proseguirono su questa strada, 
descrivendo il contenuto della GU come «conoscenza del 
linguaggio». È curioso che questa incompatibilità sia stata 
notata di rado (per non dire mai) dai generativisti stessi. Di 
certo, le sue implicazioni non sono mai state discusse né 
analizzate a fondo. 

Il linguaggio ha sempre occupato un posto centrale per la 
disciplina nota come scienza cognitiva. Forse si dovrebbe 


cominciare a considerare se invece il linguaggio (almeno 
nella sua struttura sintattica di base) non sia qualcosa che 
cade al di fuori dell’ambito della cognizione - qualcosa che 
senza dubbio la rende possibile, pur non essendone di per 
sé una parte costitutiva. Il linguaggio avrebbe allora due 
aspetti chiaramente separabili: un meccanismo integrato 
compito-specifico, finalizzato a produrre strutture 
sintattiche di base, e un meccanismo (o dei meccanismi) 
legato a compiti più generali, finalizzato ad apprendere le 
parole e i processi sintattici di livello inferiore (non limitati 
a quelli che comprendono un ordine lineare) necessari per 
assemblare le parole in modi che aumenterebbero il suo 
valore come strumento per comunicare. 

Per quanto possa sembrare astratta, questa ipotesi è 
facilmente testabile. Se è corretta, si dovrebbe poter 
sviluppare una teoria del linguaggio che raggiunga due 
obiettivi distinti. Il primo è quello di produrre un modello 
del linguaggio che sia plausibile in termini di biologia, 
neurobiologia e per le scienze del comportamento più in 
generale. Il secondo è quello di produrre un modello che 
abbia potere esplicativo quando venga applicato ai vari 
processi dinamici nei quali il linguaggio è stato (ed è 
ancora) coinvolto. In altri termini, deve essere in grado di 
predire e rendere necessarie le caratteristiche 
dell'evoluzione del linguaggio, dell’acquisizione della 
lingua, della creolizzazione e delle trasformazioni 
linguistiche che venivano in precedenza considerate come 
arbitrarie o come prodotte da cause diverse. Proporre una 
tale teoria è lo scopo principale di questo libro. 

La logica del PM ha costretto la grammatica generativa a 
prendere la direzione del modello che viene proposto in 
questo libro. Dando una sorprendente anticipazione delle 
sue linee generali, Boeckx (2010, p. 26) ha scritto: «Una 
volta che si guardi alla GU come a qualcosa di molto più 
sotto-specificato di quanto non abbiamo pensato finora, 
l’esistenza stessa della variazione acquista una ragione 


piuttosto chiara: la variazione c’é proprio perché il genoma 
non fissa tutti i dettagli della Grammatica Universale ... Un 
approccio di tipo minimalista al linguaggio rende 
inevitabile la variazione». Le pagine che seguono 
renderanno questo modello esplicito. Il capitolo 5 
descriverà il contenuto della GU «sotto-specificata», 
mentre nel capitolo 6 parlerò della variazione che tale 
sotto-specificazione impone al linguaggio. 

Tuttavia questo modello rappresenta molto di più del 
logico compimento dell'impresa generativista. È anche il 
modello che risulta più compatibile con tutto ciò che oggi 
sappiamo di biologia evolutiva. I prossimi due capitoli 
mostreranno il perché. 


POSCRITTO 


Avevo promesso che alla fine di questo capitolo avrei 
discusso più nel dettaglio il motivo per cui non possiamo 
ridurre want to a wanna all’interno di frasi che hanno certe 
proprietà. Si considerino le seguenti frasi dell’inglese: 


1. Who do you want to (wanna) meet? 
«Chi vuoi incontrare?». 

2. Iwant to (wanna) meet Mary. 
«Voglio incontrare Maria». 

3. Who do you want to (*wanna) meet 
Mary? 
«Chi vuoi che incontri Maria?». 

4. I want John to meet Mary. 
«Voglio che Giovanni incontri Maria». 


(2) è una risposta grammaticale (per quanto prolissa) a 
(1), e (4) è una risposta simile a (3). Si noti che, in (4), want 
to non può essere ridotto a wanna perché, tra want e to, si 
interpone John. Ma in (3) niente sembra interporsi tra loro. 
Tuttavia questa posizione è precisamente il punto in cui 


sarebbe comparso who («chi») all’interno di una domanda 
che esprime «sorpresa» o richiede «conferma» come (5): 


5. You want who to meet Mary? 


Questa è la posizione che di norma è occupata dal 
soggetto della subordinata SOGGETTO to meet Mary. Il 
Merge deve, innanzitutto, individuare tutti i costituenti 
nelle loro frasi di appartenenza; solo dopo, essi possono 
comparire all’inizio della frase. Se adottiamo quella che è 
stata chiamata la «teoria copia del movimento» (altra 
caratteristica che sembra avvicinare la teoria a ciò che un 
cervello potrebbe fare realmente), allora quello che 
compare in frasi come (1) e (3) è una copia del who 
originale. Dal momento che who è il soggetto di meet, deve 
in origine essere combinato all’interno della stessa frase di 
quel verbo. Poiché inoltre who è qualcosa su cui ci si sta 
facendo una domanda, esso deve (almeno in inglese) 
comparire in posizione iniziale. Perciò il cervello prima 
assembla (3) con who nella posizione che occupa in (5) e 
poi combina [merges] la sua copia, in modo che ciò che il 
cervello costruisce è di fatto (6): 


6. Who do you want who to meet Mary? 


La seconda occorrenza di who semplicemente non viene 
pronunciata, dal momento che ci sono delle restrizioni 
(troppo complesse per essere discusse qui) che in alcune 
circostanze proibiscono la ricorrenza di certi costituenti 
particolari. Ma il fatto che qualcosa non venga pronunciato 
non significa che quella cosa non ci sia in una qualche 
forma abbastanza sostanziale da impedire la contrazione in 
wanna. Gli empiristi, che trovano tutto questo sgradevole, 
dovrebbero riflettere sul fatto che il plurale di sheep 
(«pecora») abbia la stessa forma del singolare, il che 
consente di dire one sheep is... ma non two sheep is... In 


generale, è l'incapacità degli empiristi di rendere conto di 
certi fatti linguistici specifici e sottili, come quelli che 
riguardano la contrazione di wanna, ad aver impedito ai 
generativisti di prendere sul serio le loro argomentazioni. 


3 
L'«UNICITÀ» DEGLI ESSERI UMANI 


Quello che propongo qui è un modello che, a differenza 
dei modelli alternativi, è compatibile con l’idea che il 
linguaggio possa essere un prodotto dell'evoluzione. È una 
tesi molto forte, ma le tesi forti sono decisamente migliori 
di quelle deboli. Rigettare una tesi debole non consente di 
esplorare a fondo un certo argomento. Rigettare una tesi 
forte, invece, richiede di scavare molto più in profondità - 
che è poi ciò di cui questo campo di studi ha 
disperatamente bisogno. Si sono fatte troppe assunzioni 
prive di fondamento e si è consentito a troppi 
fraintendimenti di passare indenni senza incontrare alcuna 
resistenza. Fra questi, i più deleteri sono quelli riguardanti 
le relazioni tra umani e animali. Alcuni di coloro che 
probabilmente si ritengono convinti sostenitori della 
continuità evolutiva tra umani e non-umani si comportano 
in realtà come se le normali assunzioni e gli approcci di 
tipo evoluzionistico non fossero validi quando si tratta degli 
esseri umani. 

l'unico aspetto positivo del comportamentismo era che 
trattava umani e animali alla pari. Tutti dovevano 
sottostare esattamente agli stessi semplici meccanismi di 
stimolo, risposta e rinforzo. Purtroppo i comportamentisti 
ignoravano il fatto che tutti gli animali sono diversi, non in 
ragione della posizione che occupano su una qualche 
ipotetica scala, ma per via della loro distribuzione 
all’interno di un certo paesaggio ecologico. Non ci sono due 
specie che possano occupare il medesimo spazio in quel 
paesaggio: ognuna di esse è vincolata in ciò che può fare 
dalle richieste della propria nicchia. I cognitivisti erano 


pronti ad accettare tutto questo, ma per loro ancor più 
importanti erano le interazioni tra comportamento e 
processi mentali. E quando si trattava di processi mentali 
umani, questi ultimi apparivano come una classe a sé 
stante. 

Per molti, forse i più, cognizione significa innanzitutto 
quel genere di attività mentali coscienti e volontarie che 
probabilmente solo gli esseri umani sono in grado di 
compiere. Non è però affatto chiaro per quale motivo le 
cose dovrebbero stare così. I processi mentali coinvolgono 
soprattutto l'elaborazione di informazioni - qualcosa che 
qualsiasi animale dotato di cervello può fare 
quotidianamente. Per esempio, un pipistrello che caccia 
insetti di notte esegue delle computazioni complesse su un 
flusso di informazioni che varia in maniera rapida e 
costante. Inoltre, quel flusso non è indipendente dal 
pipistrello stesso. È quest’ultimo a produrre 
deliberatamente quel flusso, generando impulsi sonori che 
possono raggiungere la frequenza di 200 al secondo. 
Servono strumenti neurali complessi per decifrare e 
interpretare l’eco creata da questi impulsi (Griffin e 
Galambos 1941; Griffin 1959). Griffin e Galambos hanno 
prodotto i primi resoconti delle proprie scoperte in 
un'epoca in cui le ricerche sul sonar e sul radar venivano 
ancora considerate dei segreti militari, e la reazione 
iniziale della comunità accademica fu di genuina 
incredulità (Dawkins 1986, p. 35). Se l’ecolocazione era 
qualcosa che richiedeva agli umani di mettere in campo 
tutto il meglio del proprio ingegno, perché non poteva 
essere considerata una forma di cognizione proprio come il 
linguaggio? Eppure, l’espressione cognizione dei pipistrelli 
compare di rado nei lavori sul loro comportamento. 

Considerate organismi di altro genere, i quali pure 
mostrano un comportamento unico - un comportamento 
che, pero, non si basa sull’elaborazione rapida 
dell’informazione ma su una forma di attività che (come il 


linguaggio) parrebbe richiedere l’interiorizzazione di un 
programma di qualche genere, un modello neurale 
abbastanza flessibile da adattarsi alle condizioni che sono 
effettivamente presenti. Per esempio, prendete il caso del 
ragno che tesse la sua tela: dapprima costruisce un ponte 
tra due rami (o tra altri oggetti che gli viene comodo 
usare); sotto di esso forma una V e la trasforma in una Y; 
collega i vertici della Y creando una cornice, dispone un 
gran numero di fili a mo’ di raggi per collegare la cornice 
con il centro della ragnatela e riempie la cornice con una 
figura a spirale; usa poi quella spirale come punto di 
riferimento per posare una seconda spirale di filo 
appiccicoso, per finire con una linea di segnalazione che lo 
avvertirà nel caso in cui un insetto dovesse rimanere 
intrappolato nella ragnatela (Harris senza data). Questo 
non è un caso in cui tutti i membri della stessa specie 
riproducono ciecamente uno schema identico. Al contrario, 
è «documentata da molto tempo e in maniera ripetuta la 
significativa variabilità intra-specifica per lo meno dei tratti 
più macroscopici di una ragnatela, come il numero di raggi, 
gli avvitamenti della spirale e lo spazio tra essi, l'angolo 
formato dal piano della ragnatela con la verticale, l’area 
della ragnatela, l’asimmetria tra parte superiore e inferiore 
e le decorazioni» (Eberhard 1990, p. 342) - proprio il 
genere di variabilità intraspecifica che abbiamo nel 
linguaggio! 

Se le cose stanno così, perché nessuno parla di 
«cognizione dei ragni»? Perché non supporre che i ragni 
che tessono ragnatele siano dotati di un qualche genere di 
«grammatica universale» per la costruzione di ragnatele, 
una grammatica corredata di nozioni sugli angoli e relative 
proporzioni di altezza e ampiezza, e forse anche di nozioni 
su cose come la resistenza alla tensione delle sostanze 
viscose, le proprietà di base delle figure geometriche, gli 
effetti prodotti dalla velocità del vento, dalla temperatura, 
dall'umidità, e così via - un tipo di conoscenza modificabile 


sulla base dell’esperienza e degli esempi forniti dagli altri 
membri della stessa specie, ma che consente anche delle 
modificazioni individuali, degli «idioletti» (potremmo 
chiamarli così) della costruzione di ragnatele? 

Penso che la risposta sia che pipistrelli e ragni eseguono 
le loro complicate operazioni per «istinto», mentre gli 
esseri umani come risultato dell’«apprendimento». 
Privilegiare l'apprendimento sull’istinto pare una mossa 
abbastanza naturale per una specie come la nostra, nella 
quale l'apprendimento ha un ruolo vitale; ma non per 
questo è meno dannosa. L'apprendimento, insieme alla 
cognizione, alla cultura e alla coscienza, orienta il fuoco 
della ricerca su una sola specie, e così le altre risultano 
interessanti soltanto nella misura in cui anticipano, per 
quanto in forme ancora rozze e primitive, le conquiste degli 
esseri umani. Ma l’ironia di tutto questo sta nel fatto che il 
linguaggio, il massimo risultato raggiunto dalla specie 
umana e (secondo Darwin, si veda il capitolo 1) la causa più 
probabile della nostra cognizione, della nostra cultura, 
della nostra coscienza e delle nostre ipersviluppate 
capacità di apprendimento, è in gran parte legato 
all’istinto. 

Considerate quei processi fisici che non esiteremmo a 
descrivere come istintivi, sotto la soglia di coscienza o al di 
fuori della cognizione. Mettete a confronto, per esempio, il 
modo in cui digeriamo il cibo e il modo in cui produciamo 
frasi. Il cibo entra nella nostra bocca, e questa è l’ultima 
cosa che sappiamo sul processo di digestione. Le parole 
lasciano la nostra bocca, e questa è la prima cosa che 
sappiamo sul processo di formazione di una frase. Abbiamo 
una qualche forma di controllo sui nostri processi di 
digestione (possiamo scegliere che cosa mangiare), ma non 
ne siamo consapevoli - a meno che qualcosa non vada 
davvero storto -, né abbiamo alcun controllo cosciente o 
volontario su di essi. Abbiamo una qualche forma di 
controllo sul contenuto dei nostri processi linguistici 


(possiamo scegliere ciò che intendiamo dire), ma non ne 
siamo consapevoli né li controlliamo, se escludiamo il 
potere di farli iniziare e finire volontariamente. Non 
possiamo decidere «inserirò prima una subordinata relativa 
e poi una avverbiale di scopo», proprio come non possiamo 
decidere «digerirò prima il gelato e poi l’hot dog». C’é stato 
un periodo della nostra vita durante il quale consumavamo 
solo latte; in seguito, dopo lo svezzamento, abbiamo potuto 
ingerire il cibo solido, e poi una quantità sempre maggiore 
di alimenti e sostanze diverse, ma non ricordiamo nulla di 
questo processo - e men che meno ricordiamo come sia 
avvenuto. C’è stato un periodo della nostra vita durante il 
quale riuscivamo a pronunciare solo dei buffi rumori; poi 
quei rumori hanno acquisito una forma regolare e sono 
divenuti parole; e così abbiamo iniziato a produrre una 
gamma di frasi sempre più ampia, ma non ricordiamo nulla 
di questo processo - e men che meno ricordiamo come sia 
avvenuto. Quale di questi processi è dunque quello 
cognitivo? 

Troppi lavori prodotti nel campo degli studi sulla 
cognizione ci spingono a focalizzare l’attenzione non 
sull’elaborazione dell’informazione in sé, ma 
sull’elaborazione dell’informazione cosciente e 
intenzionale. Perciò ‘mentre l’attenzione prestata 
all'elaborazione dell’informazione negli animali è stata 
poca, l'elaborazione dell’informazione negli esseri umani si 
è presa di solito il centro della scena. Dei sei lunghi articoli 
che aprono la MIT encyclopedia of the cognitive sciences 
(Wilson e Keil 2001), la metà («Filosofia», «Intelligenza 
computazionale», «Linguistica e linguaggio») riguarda 
ambiti che per definizione concernono solo gli esseri umani 
e le loro invenzioni, e i rimanenti («Psicologia», 
«Neuroscienze», «Cultura, cognizione ed evoluzione») si 
concentrano comunque principalmente sugli esseri umani. 
Quando vengono presi in considerazione i comportamenti 
non umani, l'interesse primario è rivolto al fatto che essi 


siano rilevanti per il comportamento umano; tipicamente, 
«Ci interessano i risultati [degli esperimenti in cui, tramite 
uno shock, si induce un’inibizione a premere un tasto] solo 
perché assumiamo che il topo stia avendo un’esperienza 
emotiva connessa alla paura umana» (Ristau 1999, p. 3). 
Ma se la scienza cognitiva tratta dell’elaborazione 
dell’informazione, allora dovrebbe occuparsi di come i 
ragni sappiano tessere le ragnatele tanto quanto si occupa 
di come gli umani sappiano formare le frasi. 

Mentre parlano o ascoltano gli altri, gli umani non sono 
più consapevoli di ciò che i loro cervelli fanno di quanto lo 
siano i ragni mentre tessono le loro tele o i pipistrelli 
mentre danno la caccia agli insetti. Il fatto che gli umani 
abbiano dei cervelli grandi e dotati di capacità 
computazionali non comuni non significa che la loro 
cognizione debba in qualche modo essere coinvolta 
nell’infrastruttura evoluta del linguaggio. Se il linguaggio è 
una forma di adattamento evolutivo, l’ipotesi nulla è che la 
sua infrastruttura sia qualcosa di puramente istintivo, una 
sorta di traccia per eseguire un insieme di routine 
algoritmico-comportamentali. 


UN «ISTINTO AD APPRENDERE»? 


Ma davvero il linguaggio differisce dalla tessitura di una 
ragnatela e dall’ecolocazione dei pipistrelli, in quanto ha in 
sé una componente sostanziale legata all’apprendimento 
che le altre due non hanno? Il modo in cui assembliamo le 
frasi a partire dalle parole può essere istintivo, ma 
dobbiamo prima aver imparato le parole; e i suoni che 
usiamo per produrre queste parole vanno affinati e messi a 
punto sulla base dell'esperienza. Non so se siano mai stati 
condotti degli esperimenti di isolamento sui pipistrelli o sui 
ragni, ma sono pronto a scommettere che, se un pipistrello 
o un ragno venisse allevato senza aver mai visto un altro 


pipistrello o un altro ragno, sarebbe comunque in grado di 
ecolocarsi o di tessere una ragnatela proprio come gli altri 
membri della sua specie. Al contrario, i bambini a cui 
qualche circostanza accidentale abbia ridotto (o addirittura 
impedito) l’accesso agli input linguistici possono non 
parlare mai; oppure, se riescono a farlo, è probabile che 
non raggiungano mai le capacità linguistiche di un adulto 
(Curtiss 1977; Newton 2002). 

Si potrebbe quindi assimilare il linguaggio a delle facoltà 
non umane di un altro genere, per esempio al canto degli 
uccelli. Ci sono specie di uccelli canori il cui canto è 
programmato tanto quanto l’ecolocazione dei pipistrelli; ma 
ce ne sono molte altre nelle quali il canto viene appreso, 
almeno in parte. È noto fin dal diciottesimo secolo che i 
membri adottati di una certa specie possono addirittura 
acquisire il canto della specie adottiva (Barrington 1773), 
proprio come i bambini adottati possono acquisire una 
lingua completamente differente da quella parlata dai loro 
genitori biologici. Più di frequente, i membri non maturi 
della specie cominciano dapprima a produrre ciò che viene 
chiamato un «sottocanto», per poi passare a quello che è 
stato chiamato «canto plastico» (Marler e Peters 1982; 
Marler e Nelson 1992; Nottebohm 2005). Il sottocanto è 
stato paragonato alla lallazione dei bambini; il canto 
plastico rappresenta quelle fasi attraverso le quali la 
produzione sonora del giovane uccello deve passare per 
poter raggiungere la piena capacità di esecuzione del canto 
tipico della sua specie - il che è paragonabile a due fasi 
dell’acquisizione della prima lingua, la fase delle «due 
parole» e la fase del «discorso telegrafico» (si veda il 
capitolo 7). La capacità di sviluppare il canto in queste 
specie è stata descritta come «un istinto ad apprendere» 
(Marler 1991), un’idea accolta da Fitch (2010) come 
potenzialmente in grado di risolvere l’annoso conflitto tra 
empiristi e innatisti. Ma davvero quest'idea ci permette di 
ritagliare un ruolo per l’istinto all’interno del linguaggio, 


consentendoci, al contempo, di guardare a quest’ultimo 
come a una funzione cognitiva e avere cosi la botte piena e 
l’oste ubriaco? 

E palese che il linguaggio, almeno in parte, dipende 
dall’apprendimento - se cosi non fosse, parleremmo 
l'umanese e non l'italiano, il cinese, lo swahili o qualsiasi 
altra lingua. Ma il conflitto tra empiristi e innatisti non 
verrà risolto da un compromesso come quello dell’istinto ad 
apprendere. Il linguaggio è chiaramente distinto in due 
parti. La prima sono le differenze tra una lingua e un’altra, 
e questa parte va appresa. La seconda sono gli elementi 
che le lingue hanno in comune. È questa la parte del 
linguaggio che sto paragonando a cose come la tessitura 
delle ragnatele e l’ecolocazione dei pipistrelli. Mescolarle 
fra loro, come fa la formula «istinto ad apprendere», non va 
bene. Gli esseri umani non hanno un «istinto ad 
apprendere» la seconda parte, quella che è simile alla 
tessitura delle ragnatele, poiché essa non richiede di essere 
appresa. Non hanno neppure un «istinto ad apprendere» la 
prima parte, quella che determina le differenze tra le 
lingue, perché non c’è bisogno di alcun tipo di istinto 
specializzato per imparare ciò che serve per diventare degli 
esseri pienamente inseriti nella particolare società nella 
quale ci è toccato in sorte di vivere. 

Fitch (2011) fornisce una visione chiara, ma io penso 
errata, di come gli uccelli non maturi sviluppino il canto; 
essa concorda con la visione più diffusa di come i membri 
non maturi della specie umana sviluppino il linguaggio: 
«Mentre è ancora nel suo nido, un uccellino ascolta 
avidamente il canto degli adulti della propria specie. Alcuni 
mesi più tardi, dopo che si è ricoperto di piume, anch’esso 
comincia a cantare e dà forma ai propri gorgoglii sonori 
iniziali sulla base del modello fornito dai ricordi archiviati 
nella propria memoria». Dubito fortemente che gli uccellini 
ancora nel nido «ascoltino avidamente» o facciano qualsiasi 
altra cosa che non sia crescere e assicurarsi di ricevere la 


propria porzione di cibo. Mi sembra molto più probabile 
che essi si limitino a mettere in atto un programma 
biologico e che successivamente, invece di regolare «i 
gorgoglii sonori» sulla base di un modello fornito dai 
«ricordi archiviati nella propria memoria», aggiustino quel 
programma per adattarsi ai modelli offerti dagli adulti che, 
nel frattempo, stanno udendo. 

Questo tipo di processo sembrerebbe caratterizzare sia 
l’«apprendimento» del canto degli uccelli sia 
l’«acquisizione» di una lingua. Nottebohm (2005) è quello 
che più si avvicina a una migliore comprensione di 
entrambi, quando suggerisce che «la discrepanza variabile 
tra un modello e il tentativo di imitarlo è alla base della 
modificazione dell'output, in un modo tale per cui degli 
schemi che prima non c’erano compaiono ora per la prima 
volta». Trasferendo la sua proposta al caso del linguaggio 
umano, ciò che metterei in discussione è solo l’espressione 
«tentativo di imitarlo». Riformulerei quindi la sua frase 
così: «La discrepanza variabile tra il risultato diretto del 
programma biologico per il linguaggio e i dati provenienti 
da una particolare lingua umana sono alla base di una 
modificazione dell’output». 

Questa caratterizzazione dello sviluppo ontogenetico del 
linguaggio metterebbe lo sviluppo degli esseri umani sullo 
stesso piano di quello delle altre specie. Credo inoltre che 
si avvicinerebbe di più alla verità. I processi evolutivi 
valgono allo stesso modo, e senza distinzioni, per la specie 
umana come per quelle non umane. 


LAPPROCCIO ALL'EVOLUZIONE IN TERMINI 
DI «CARATTERISTICHE COMPONENTI» 


Il trattamento speciale riservato agli esseri umani negli 
studi di evoluzione non si limita agli esempi forniti sopra: 
esso viene rafforzato dall’introduzione dell’approccio in 
termini di «caratteristiche componenti». Quest'ultimo deve 


molta della propria fama al fatto di essere frequentemente 
presentato come un esempio del metodo comparativo, uno 
degli strumenti fondamentali della biologia evolutiva. 

«Le comparazioni stabiliscono la generalita dei fenomeni 
evolutivi ... Dai tempi di Darwin a oggi, il metodo 
comparativo è rimasto la tecnica più generale per porre 
delle domande sui tratti comuni dei cambiamenti evolutivi» 
(Harvey e Pagel 1991, pp. 1-2). Nel linguaggio però vi sono 
poche «generalità» o «tratti comuni» (ammesso che ve ne 
siano) - il linguaggio è una forma unica di comportamento. 
Quindi, che cosa devono fare i ricercatori quando si 
imbattono in forme di questo tipo? 

C'è una sola cosa che non hanno mai fatto, a parte 
quando si occupano di linguaggio: prendere in 
considerazione un certo tratto o comportamento unico 
proprio di una specie, scomporlo in quelle che sembrano le 
sue parti componenti, e poi provare a determinare se quelle 
componenti (o dei loro analoghi) si possano trovare anche 
in altre specie - preferibilmente strettamente imparentate, 
ma altrimenti anche localizzate in qualsiasi punto 
dell’albero filogenetico -, con l’obiettivo di spiegare quale 
sia stata l'evoluzione di quel tratto o comportamento unico. 
Non siamo cioè a conoscenza di tentativi di spiegare la 
capacità sviluppata dai ragni di tessere ragnatele 
scomponendola nelle sue componenti - la produzione dei 
filamenti, l’intrappolamento passivo, ecc. -, per poi andare 
a guardare quali altre specie, connesse o meno ai ragni, 
siano riuscite a padroneggiarle. Non è impossibile farlo: si 
potrebbe prendere in esame la produzione dei filamenti nei 
bachi da seta e nelle larve di tricotteri, o l’intrappolamento 
nei formicaleoni, nella rana pescatrice, nella specie di 
formiche Allomerus decemarticulatus (Dejean et al. 2005) e 
magari nelle piante carnivore come le drosere, e così via. 

Oppure prendete l’ecolocazione nella precisa e unica 
forma che essa ha assunto nei pipistrelli. Molte altre specie 
utilizzano suoni per localizzare gli ostacoli o per cacciare, 


inclusi i delfini e le balene, i guaciari, i rondoni, i toporagni 
e i tenrec. Non potrebbero essere utili per fare un po’ di 
luce su come si sia evoluta l’ecolocazione nei pipistrelli? 

Questa possibilità non sembra neppure essere stata presa 
in considerazione. I lavori sull'evoluzione dei pipistrelli (per 
esempio, Neuweiler 2003; Jones e Holderied 2007; Li et al. 
2007) non menzionano l’ecolocazione se non per gli 
antenati dei moderni pipistrelli, assumendo (senza 
discuterlo) che questo tratto si sia evoluto interamente 
come risposta alle circostanze peculiari in cui si sono 
trovati i pipistrelli. Invece un caso come questo si presta 
certo a un approccio in termini di «caratteristiche 
componenti» più del caso delle lingue negli esseri umani. 
Dopotutto, gli umani sono una specie e le lingue, 
nonostante le loro numerose differenze superficiali, non 
sono raggruppate in classi distinte e demarcate in maniera 
chiara sulla base di princìpi fondamentalmente differenti. 
Lecolocazione, al contrario, assume forme abbastanza 
diverse a seconda dei diversi lignaggi di pipistrelli. Di 
sicuro, sarebbe abbastanza naturale assumere che le 
differenze tra le diverse forme di ecolocazione siano sorte 
in ragione di diverse selezioni di caratteristiche componenti 
- alcune delle quali, forse, si trovano nei tenrec ma non nei 
guaciari, o viceversa. Potremmo ragionevolmente 
attenderci di trovare una letteratura considerevole su come 
ogni lignaggio abbia selezionato la propria forma di 
ecolocazione a partire dalle componenti trovate in altre 
specie che la usavano. Ma non c’è niente di tutto ciò. 

Una delle cose che troviamo è però che al gene FoxP2 è 
stato attribuito un certo ruolo nell’ecolocazione, il che ha 
condotto Li et al. (2007) a proporre l’idea che 
l’'ecolocazione dei pipistrelli sia un precursore del 
linguaggio umano! È considerato in qualche modo legittimo 
ignorare i possibili precursori di un particolare 
comportamento e, ciò nonostante, sostenere che esso sia il 
precursore di un altro comportamento, a patto che 


quest’ultimo sia un comportamento umano - difficile 
trovare un esempio della politica dei due pesi e due misure 
in biologia più chiaro di questo. 

Eppure, secondo Hauser et al. (2002), combinare 
«precursori» e «caratteristiche componenti» è 
semplicemente un modo di giocare la carta vincente della 
biologia, il metodo comparativo. Vale la pena di seguire nel 
dettaglio il loro ragionamento (p. 1572). Cominciano 
sostenendo che chiedersi se le caratteristiche componenti 
della facoltà del linguaggio siano o meno delle esclusive 
degli esseri umani sia una domanda «d’interesse generale» 
nel campo degli studi sull'evoluzione del linguaggio. Dal 
momento che agli esseri umani sono spesso stati attribuiti 
dei tratti unici su basi scorrette, essi sottolineano quanto 
sia essenziale dimostrare - preferibilmente per via 
sperimentale - che le altre specie non possiedono quei 
tratti. Se le altre specie li possiedono, possono essere 
omologhi o analoghi. Per esempio, molti uccelli canori 
hanno in comune con gli esseri umani la caratteristica di 
apprendere la vocalizzazione, ma «sebbene i meccanismi 
sottostanti all'acquisizione negli uccelli canori e nel 
linguaggio umano siano chiaramente analoghi, per quanto 
non omologhi, le loro componenti centrali hanno una base 
neurale e di sviluppo comune che è rimasta pressoché 
intatta» (p. 1572). 

In merito al «problema dell’unicità», è lecito chiedersi 
perché esso venga trattato come qualcosa «d'interesse 
generale» quando si considerino gli esseri umani, ma non 
quando ci si occupi di altre specie. Per quanto concerne i 
«tratti unici» già attribuiti agli esseri umani, la loro unicità 
non è stata confutata scomponendoli in caratteristiche 
componenti, ma mostrando che altri animali possiedono dei 
tratti del tutto simili, sebbene forse meno sviluppati. Per 
esempio, la capacità di produrre utensili si riteneva fosse 
un tratto unico degli esseri umani finché non si è scoperto 
che anche gli scimpanzé producono e usano utensili. Perciò 


il linguaggio rimane un tratto unico degli esseri umani 
finché non si riesca a dimostrare che qualche altra specie 
possegga qualcosa che i linguisti potrebbero considerare 
linguaggio. Nella storia della biologia, nessuno ha trattato 
anche uno solo degli altri tratti specie-specifici come 
qualcosa che potesse essere scomposto in una lista di 
presunte caratteristiche componenti e spiegato in maniera 
esaustiva passando al setaccio la natura di specie che 
potrebbero mostrare delle caratteristiche simili in contesti 
genomici, epigenetici ed ecologici diversi. 

Lidea secondo cui potrebbe essere utile scomporre il 
linguaggio in un insieme di componenti discrete sembra 
aver avuto origine con Hockett (1960; Hockett e Altmann 
1968), il quale ha pubblicato una lista di tredici (poi 
allargata a sedici) «proprietà caratterizzanti» del 
linguaggio, tra cui annovera cose come la «semanticità» (la 
connessione tra suoni e significato) e la «discretezza» (il 
fatto che i suoni del linguaggio sono percepiti come 
separati e distinti gli uni dagli altri, anche se da un punto di 
vista fonetico possono essere continui, specialmente nel 
caso delle vocali). Hockett ha riscontrato la presenza di 
pressoché tutte queste caratteristiche nel comportamento 
di questa o quell’altra specie. Hauser (1996, pp. 48-49) si 
era già espresso positivamente in merito alle 
caratteristiche individuate da Hockett, sebbene le 
caratteristiche selezionate nell’articolo scritto con 
Chomsky e Fitch (Hauser et al. 2002) tendano a essere 
meno descrittive e più funzionali (a riprova del fatto che la 
scelta delle caratteristiche nelle quali un tratto viene 
scomposto è arbitraria, essendo determinata dalle 
assunzioni e dalle preferenze dell'osservatore). 

Abbiamo quindi tutte le ragioni per essere scettici 
sull’approccio in termini di scomposizione dei tratti. 
Qualsiasi tratto complesso - che sia la tessitura della tela 
da parte dei ragni, la costruzione delle dighe da parte dei 
castori o la produzione di frasi da parte degli esseri umani - 


ha la propria struttura interna, le proprie relazioni esterne 
con gli altri tratti e la sua applicazione specifica a una 
particolare sfida ecologica con la quale la specie in 
questione si è trovata a fare i conti. Supponiamo che sia 
davvero possibile (anche se probabilmente non lo è) risalire 
alle singole componenti di un certo tratto e ritrovare quelle 
stesse componenti (o delle componenti simili) nei tratti 
complessi delle altre specie. Consideriamo una tale 
componente, chiamiamola F, e diciamo che si combina con 
le componenti U, V e W per dare origine al tratto complesso 
TC1 nella specie A. Supponiamo che F, o qualcosa di simile 
a F, si ritrovi anche nella specie B. Nella specie B, però, F si 
combina con W, X, Y e Z per dare origine al tratto 
complesso TC2. Può F essersi sviluppata nello stesso modo? 
Non dovremmo forse dire che ciò che si è davvero evoluto 
sia TC1 o TC2 e che la linea di sviluppo seguita da E 
nonché la precisa forma assunta da F, siano marcatamente 
diverse nei due casi per via dell’interazione di F con U, V e 
W in un caso e con W X, Y e Z nell'altro? Cose come la 
«percezione categorica» e la «vocalizzazione appresa» non 
sono categorie evolutive valide e indipendenti; sono 
categorie astratte, le cui varie esemplificazioni possono 
avere delle traiettorie di sviluppo ed evolutive abbastanza 
diverse e possono svolgere funzioni abbastanza differenti 
da specie a specie. 

Hauser et al. (2002, p. 1572), tuttavia, basando la propria 
posizione sull’interpretazione data dalla «evo-devo», la 
biologia evolutiva dello sviluppo, hanno concluso che le 
varie esemplificazioni di F debbano avere «una base 
neurale e di sviluppo comune che è rimasta pressoché 
intatta». 


SOVRASTIMARE LA EVO-DEVO 


Qualche decina di anni fa era convinzione diffusa che i 
singoli geni giocassero ruoli molto specifici - che i geni 
responsabili della formazione delle braccia umane non 
fossero quelli responsabili delle zampe anteriori nei topi, i 
quali, a loro volta, erano diversi da quelli responsabili delle 
ali degli uccelli. Ne discendeva che pit complesso era un 
organismo, maggiore doveva essere il numero dei suoi 
geni. Ma via via che si procedeva alla mappatura dei 
genomi delle varie specie (C. elegans Sequencing 
Consortium 1998; Adams et al. 2000; Arabidopsis Genome 
Initiative 2000; Rat Genome Sequencing Project 
Consortium 2004; e altri studi simili), cominciarono a 
emergere dei fatti sorprendenti. Il numero dei geni variava 
di poco tra le diverse specie (la maggior parte degli 
animali, compresi gli esseri umani, e molte piante ricadono 
in un range di circa 20.000 geni [+/ - 10.000]) ed è venuto 
fuori che gli stessi geni sono responsabili della produzione 
delle ali, delle zampe anteriori e delle braccia. 

Il sequenziamento del genoma fu una manna dal cielo per 
la rapida espansione del campo della biologia evolutiva 
dello sviluppo, o evo-devo, la quale affondava le proprie 
radici negli studi del diciannovesimo secolo ed era ormai 
già ben consolidata, quando cominciò il sequenziamento 
(Goodman e Coughlin 2000). Quest'ultimo contribuì a 
confermare alcune delle più importanti tesi in quel campo 
di ricerca: che i geni fossero molto più flessibili di quanto si 
era pensato, che l’espressione genica potesse essere 
influenzata dall'ambiente, che fattori epigenetici giocassero 
un ruolo significativo nello sviluppo e che i cambiamenti 
nello sviluppo fossero dei potenti fattori determinanti delle 
apparenti novità evolutive. 

La scoperta di ciò che va sotto il nome di «omologie 
profonde» (Shubin et al. 2009; Scotland 2010) - le 
connessioni tra organismi che potrebbero essere 
imparentati solo alla lontana, le quali erano state 
derubricate dalle precedenti generazioni a semplici 


analogie, ma nelle quali erano in realta coinvolti gli stessi 
geni - condusse Hauser e i suoi co-autori (2002) ad 
assumere che anche le componenti del linguaggio umano 
potessero coinvolgere delle omologie profonde. Se fosse 
stato davvero cosi, la loro ricerca di «precursori» o di 
«caratteristiche componenti» del linguaggio sarebbe stata 
legittimata. Ma la maggior parte di quelle componenti 
erano dei comportamenti più che delle forme strutturali, e 
la evo-devo riguarda principalmente la forma. Carroll 
(2005, p. 4 [trad. it. p. 5]) - la Bibbia della evo-devo, 
continuamente citata da molti, tra i quali Hauser et al. 
(2002) - afferma all’inizio della sua introduzione: 
«L'ispirazione iniziale per questa storia è l'attrazione che 
tutti condividiamo per la forma animale, ma il mio obiettivo 
è estendere questa meraviglia e fascino a come la forma 
viene creata, cioè alla nostra nuova comprensione dei 
processi biologici che generano struttura e diversità nei 
modelli animali» (corsivo mio). Infatti, Hoekstra e Coyne 
(2007, p. 997), in un articolo che critica le tesi più estreme 
della evo-devo, affermano che «i difensori della evo-devo ... 
tracciano una distinzione netta tra l’evoluzione 
dell'anatomia e l'evoluzione di tutti gli altri tratti» e che «la 
teoria della regolazione genica ignora ampiamente gli 
adattamenti che hanno condizionato il comportamento». 

La evo-devo è ancora giovane. Il fatto che non sia ancora 
riuscita a dare una spiegazione di come si sviluppi il 
comportamento umano non vuol dire che non riuscirà a 
farlo in futuro. Al tempo stesso ci sono buone ragioni per 
essere scettici. Il comportamento è sottoposto al controllo 
diretto dei geni in misura considerevolmente minore 
rispetto alla forma. Questo si può evincere dalla natura 
stessa del comportamento. Supponiamo di avere una specie 
X che si comporta nel modo Y. La capacità di avere un certo 
comportamento dipende inevitabilmente dal fatto di 
possedere la forma richiesta - un cervello abbastanza 
grande, degli organi di senso sufficientemente sviluppati, 


gli arti situati nei posti giusti, e tutto il resto - e sono dei 
fattori biologici, genetici o epigenetici a imporre che quella 
forma sia presente in tutti i membri normali di X. In altri 
termini, essere un membro di X determina la capacità di 
mettere in campo Y. Ma la capacità di mettere in campo Y 
non determina che Y venga effettivamente messo in campo. 
Se Y viene messo in campo o meno dipende da una cosa e 
una soltanto: se quei membri della specie che mettono in 
campo Y in maniera affidabile e coerente contribuiscono al 
pool di geni in misura per lo meno uguale a quanto vi 
contribuiscono quelli che non lo fanno. Sono perciò i fattori 
ambientali che rendono Y desiderabile o necessario - e non 
le funzioni che determinano la forma della evo-devo o altro 
- ad avere in ultima istanza il controllo sul fatto che Y 
venga messo in campo. 

In altre parole, è coinvolta la selezione naturale. Nessuno, 
se non un fantoccio pan-adattazionista, potrebbe negare 
che esistano delle leggi della forma, delle leggi di 
ridimensionamento e altri fattori non selettivi che sono 
importanti nell'evoluzione quanto la selezione naturale. 
Tuttavia essi operano in modi e in tempi differenti. I fattori 
descritti dalla evo-devo (e altri) determinano quali tipi di 
organismi possono evolvere in un mondo con le 
caratteristiche fisiche e chimiche del nostro. La selezione 
naturale interviene in seguito su questi organismi, 
determinando se i loro adattamenti si diffonderanno a 
livello di tutta la specie, se rimarranno minoritari o se 
spariranno del tutto. 

Di conseguenza, fare appello alla evo-devo e alle 
omologie profonde per giustificare un approccio 
all'evoluzione del linguaggio in termini di «caratteristiche 
componenti» è, nel migliore dei casi, prematuro; nel 
peggiore, è un vicolo cieco. I tratti complessi - siano essi le 
ragnatele, le dighe dei castori o il linguaggio umano - 
evolvono come degli interi, e non come delle mere somme 
di ingredienti, nelle specie che ne hanno bisogno per 


sfruttare appieno una qualunque nicchia alla quale abbiano 
avuto accesso o che abbiano creato. Cio che la evo-devo 
mostra in maniera molto chiara è il grado di plasticità 
nell'espressione che permette ai medesimi geni di produrre 
cose apparentemente tanto diverse come le ali dei 
pipistrelli, le ali degli uccelli, le zampe anteriori dei topi e 
le braccia umane (Goodman e Coughlin 2000; Gilbert e 
Sarkar 2000; Carroll 2008). Connettere la evo-devo alla 
teoria della costruzione della nicchia (Laland et al. 2008) 
apre nuovi e illuminanti modi di approcciare l'evoluzione - 
non soltanto quella del linguaggio, ma quella di ogni nuova 
e complessa forma di comportamento. 

Hauser et al. (2007, p. 108) fanno almeno 
un'osservazione eccellente: «Lobiettivo [nel trattare 
possibili analogie] non è testare in maniera scriteriata ogni 
specie presente sulla faccia della Terra, ma piuttosto 
pensare ai modi in cui delle specie anche molto distanti tra 
loro, dato un certo insieme di vincoli, possano avere 
problemi ecologici o sociali comuni, tali da generare delle 
pressioni selettive comuni e, in ultima istanza, soluzioni 
comuni» (corsivo mio). Tuttavia né l’articolo citato né, a 
quanto ne so, nessun altro lavoro che assuma un approccio 
in termini di «caratteristiche componenti» ha prodotto un 
qualche tentativo di sviluppare un tale programma. Di 
fatto, nella letteratura che precede Bickerton (2009), io so 
di un solo autore, Dunbar (1996), che abbia collegato 
l'evoluzione del linguaggio a un qualche «problema 
ecologico o sociale» peculiare degli antenati degli esseri 
umani. (Sorvolo sui frequenti riferimenti a non meglio 
specificate «pressioni sociali», dal momento che esse non 
vengono mai chiarite in modo sufficiente a rendere 
possibile una discussione). Per tutti gli altri autori, il 
linguaggio sembra essersi evoluto nel vuoto ecologico, una 
mancanza tanto sorprendente quanto deplorevole. 


IL «PATCHWORK» 
DELLE CARATTERISTICHE COMPONENTI 


Hauser et al. (2007, pp. 128-29) offrono una sintesi del 
proprio approccio dicendo che si tratta di una «teoria 
dell’evoluzione del linguaggio intesa come una trapunta 
patchwork». Le caratteristiche componenti del linguaggio 
presenti anche in altre specie sarebbero le pezze di stoffa 
di cui è fatta la trapunta e sarebbero state «intrecciate 
l'una con l’altra negli esseri umani dall’innovazione 
sintattica specie-specifica». Per accettare una tale teoria, 
dobbiamo prima ammettere che tutte le caratteristiche 
componenti del linguaggio (ad eccezione di alcune 
«innovazioni sintattiche», presumibilmente la ricorsività o il 
Merge) siano in qualche modo venute a convergere negli 
umani moderni, o in qualcuno dei loro antenati ominidi 
immediatamente precedenti. Ma perché dovrebbe essere 
andata così? E come è stato possibile questo? 

Per amor di discussione, supponiamo che questo sia stato 
in qualche modo possibile (anche se probabilmente non è 
così). Per definizione, tutte queste componenti devono 
essere state impiegate da altre specie per eseguire dei 
compiti non linguistici. Per quale ragione esse non 
avrebbero dovuto semplicemente continuare a eseguire 
soltanto quegli stessi compiti anche negli esseri umani? 
Come e perché la mera aggiunta di una sola nuova 
componente avrebbe portato all’intreccio delle varie pezze 
di stoffa per formare la trapunta? Non vengono date 
spiegazioni. 

Se prima della comparsa dell’«innovazione sintattica» 
non c’era nulla di simile a un linguaggio, dobbiamo forse 
assumere che quest’ultimo sia emerso all'improvviso e già 
essenzialmente nella sua forma moderna? Così crede 
Chomsky, uno dei co-autori di Hauser et al. (2002): «A un 
certo punto dev’essere comparso il Merge senza 
limitazioni» (il Merge senza limitazioni è il prodotto della 


ricorsivita); e quindi «sembra superfluo assumere degli 
stati precedenti» (Chomsky 2010, p. 54). Vale la pena di 
notare che un altro degli autori di quell’articolo la pensa in 
maniera diametralmente opposta: Fitch (2010) dedica tre 
capitoli su quindici alla discussione di vari modelli ipotetici 
di proto-linguaggio e si pronuncia a favore di un tipo di 
proto-linguaggio musicale che Darwin (1871) aveva 
proposto per primo. Hauser non ha mai reso esplicita la 
propria posizione in merito; ma, come quella di Chomsky, 
essa sembra necessariamente escludere ogni intervento 
diretto della selezione naturale nell’evoluzione del 
linguaggio. 

Invece, non importa quanto sostanziale sia stato il 
contributo delle «omologie profonde» o quante 
caratteristiche componenti siano state accumulate da 
qualcuno dei primi esseri umani: senza la selezione 
naturale non sarebbe accaduto nulla. Le varie 
caratteristiche componenti avrebbero semplicemente 
continuato a svolgere il proprio ruolo originario, se qualche 
pressione selettiva non avesse condotto a una qualche 
forma di linguaggio. E il linguaggio, per quanto in forma 
embrionale, deve in qualche modo aver aumentato 
l'adattamento di chiunque lo possedesse; in caso contrario 
non si sarebbe stabilizzato nessuno dei cambiamenti che 
l'hanno supportato. Centrali per ogni ricerca su come si sia 
evoluto il linguaggio sono le domande su come e perché 
esso si sia evoluto in un certo modo piuttosto che in altri e 
sul perché nessun’altra specie collegata abbia fatto un 
passo (neppure un piccolo passo) nella direzione del 
linguaggio, pur avendo (presumibilmente) a disposizione, 
se non tutte, almeno un ampio sottoinsieme delle 
caratteristiche componenti richieste. Anzi, più alto è il 
numero delle caratteristiche componenti che si sostiene 
siano presenti nelle altre specie, più diventa misterioso il 
motivo per cui gli esseri umani, e soltanto loro, abbiano 
sviluppato il linguaggio. 


Non solo la teoria «della trapunta patchwork» non da 
risposta a delle domande importanti (forse le pit 
importanti) su come si sia evoluto il linguaggio, ma essa ha 
anche diverse implicazioni che qualsiasi biologo 
preferirebbe certo evitare. L'idea che le parti componenti 
del linguaggio si siano assemblate gradualmente nel tempo 
finché il mero fatto che si trovassero tutte assieme non 
abbia dato vita al linguaggio suggerisce una visione 
progressiva e teleologica dell'evoluzione - il che è 
compatibile più con il creazionismo, o con il disegno 
intelligente, che non con la scienza naturalistica. In effetti, 
la teoria della trapunta patchwork richiede che ci sia un 
Sarto; e se quel Sarto non è stato la selezione naturale, 
allora che cosa è stato? Eppure, Hauser e i suoi colleghi 
(2007) non menzionano la selezione naturale neppure una 
sola volta in tutto l’articolo, e soltanto due volte parlano di 
pressioni selettive - una volta nel passaggio citato sopra e 
un’altra volta alla fine, a mo’ di aggiunta (p. 128) e in 
termini altrettanto generali. Sembrano ritenere che sia 
auto-evidente che il linguaggio fosse destinato a essere 
selezionato; e questo, insieme all’implicazione che le sue 
caratteristiche componenti continuavano ad ammassarsi da 
milioni di anni in maniera costante e graduale, 
inevitabilmente riporta alla mente la tanto screditata scala 
naturae o la Grande Catena dell'Essere stabilita da Dio. 


RISALENDO LA SCALA FINO AGLI ESSERI UMANI 


Avendo criticato apertamente l'approccio in termini di 
«Caratteristiche componenti», è ora doveroso che menzioni 
uno dei suoi aspetti più positivi. Esso è servito a distogliere 
l’attenzione dall'approccio che Pepperberg (2007) aveva 
chiamato «primato-centrico», che si focalizzava sui 
«precursori» del linguaggio limitandosi a considerare le 
specie strettamente connesse a quella umana. 


Non sorprende che un approccio primato-centrico abbia 
potuto farla da padrone così a lungo negli studi 
sull'evoluzione del linguaggio, data la coincidenza di due 
potenti forze. La prima era la convinzione che l’evoluzione 
non possa non passare attraverso innumerevoli piccoli 
cambiamenti - e perciò che debba essere un processo 
graduale e continuo. La seconda era l'influenza di quello 
che si potrebbe chiamare «trionfalismo genetico» - l’idea, 
ampiamente diffusa nei decenni successivi alla scoperta del 
codice genetico da parte di Crick e Watson e ben 
esemplificata da Dawkins (1976), che i geni fossero degli 
agenti invarianti e onnipotenti del cambiamento evolutivo. 
Considerate queste due cose insieme, e date le somiglianze 
genetiche tra scimmie ed esseri umani, sembrava logico 
andare alla ricerca dei precursori immediati del linguaggio 
negli antenati dei primati. Dal momento che questi antenati 
erano estinti ormai da lungo tempo, l’unica opzione 
sembrava lo studio delle specie di primati più vicine agli 
esseri umani, nonostante le ampie differenze 
comportamentali tra questi ultimi, da una parte, e 
scimpanzé, bonobo e gorilla, dall'altra. 

In effetti, le somiglianze tra specie strettamente connesse 
non si trovano sempre, neppure rimanendo nel dominio 
dell’aspetto fisico, figuriamoci in quello del 
comportamento. Si prendano tre specie apparentemente 
molto diverse: l'elefante, l’irace e il dugongo. Sulla base 
della loro apparenza fisica, un’assunzione che è naturale 
fare è che l’elefante sia legato più strettamente ad altri 
mammiferi dalla pelle spessa (ippopotamo o rinoceronte), 
che l’irace sia un piccolo roditore e che il dugongo 
discenda in qualche modo dalle foche. In realtà molte prove 
mostrano che queste tre specie sono legate tra loro molto 
più strettamente di quanto non lo siano con ogni altra 
specie (Stanhope et al. 1998; Nishihara et al. 2005). Non 
c'è bisogno di dire che cercare i «precursori» di 
caratteristiche uniche, fisiche (il tronco dell’elefante) o 


comportamentali (la sua comunicazione a bassa frequenza), 
negli iraci o nei dugonghi sarebbe abbastanza inutile. Ma il 
grado maggiore di somiglianza fisica tra scimmie ed esseri 
umani sembra aver condotto i ricercatori ad assumere che 
dovessero esistere delle somiglianze paragonabili anche a 
livello comportamentale. 

In realtà, la linea di ricerca proposta da Hauser et al. 
(2002, 2007) ha indicato che, anche adottando un 
approccio in termini di caratteristiche componenti, ci sono 
molte caratteristiche per le quali specie evolutivamente più 
distanti da noi sembrano prestarsi molto meglio rispetto ai 
grandi primati. Il «riferimento funzionale» (espresso nei 
segnali usati per comunicare ad altri membri della stessa 
specie l'avvicinarsi di predatori), che alcuni considerano un 
precursore delle parole, è stato riscontrato nei cercopitechi 
(Cheney e Seyfarth 1988) e anche nei polli (Evans et al. 
1993), ma non si trova nella comunicazione dei grandi 
primati. L'apprendimento vocale delle scimmie, al pari della 
loro capacità di riprodurre i suoni del linguaggio (Hayes e 
Hayes 1952), è minore di quello dei pappagalli (Pepperberg 
1991), dei delfini (Richards et al. 1984) e perfino delle 
foche comuni (Ralls et al. 1985). Eppure queste differenze 
non vengono solo ignorate, ma sono talvolta addirittura 
negate, nonostante l’evidenza empirica del contrario. 
Discutendo l’assenza di riferimento funzionale nella 
comunicazione delle scimmie antropomorfe, Mithen (2005, 
p. 113) afferma che «è in questo campionario di primati 
africani, e non in quello delle scimmie o dei gibboni, che 
vanno rintracciate le radici del linguaggio umano e della 
musica. Lapparente maggiore complessità dei segnali delle 
scimmie deve essere un'illusione dovuta alla nostra limitata 
comprensione dei segnali dei primati» (corsivo mio). 

Le osservazioni di Mithen (2005) si basano su 
un'assunzione diffusa, per quanto raramente esplicitata: la 
comunicazione animale si è evoluta in virtù di quel genere 
di processo simile a un dente d’arresto che ha prodotto gli 


occhi o le ali - un processo che si sviluppa a partire da un 
inizio semplice, ma trattiene ciascun miglioramento finché 
il prodotto finale non è un organo complesso, 
meravigliosamente adattato per il proprio compito. I 
repertori di segnali di alcune specie - sembra inappropriato 
qui parlare di «sistemi», dal momento che non hanno una 
struttura interna - contengono più unità di quelli di altre, 
ma non c’è una correlazione coerente tra la complessità 
della specie e il numero di segnali (Wilson 1972). A 
differenza del linguaggio, nessun repertorio di segnali ha 
una qualche struttura interna, non c’è nulla che 
corrisponda neppure alla grammatica più semplice. In 
effetti, non ci sono segni di «progresso» in nessuna 
direzione, men che mai in quella del linguaggio umano. Ma, 
ancora una volta, gli umani (e qualsiasi cosa li riguardi) 
vengono considerati speciali. Soltanto quando l’oggetto di 
studio è qualcosa relativo all'uomo, si suppone che un 
repertorio di segnali preesistente debba diventare capace 
non solo di evolversi, ma anche di farlo in un sistema 
complesso, a differenza di qualsiasi altra cosa in natura. 
Basta fermarsi un momento a riflettere e diventa subito 
chiaro perché  l’evoluzione fisiologica e quella 
comportamentale debbano essere diverse l’una dall’altra: è 
la stessa ragione per cui la evo-devo è stata in grado di 
rendere conto degli adattamenti fisiologici ma non di quelli 
comportamentali. La fisiologia è controllata dai geni più 
strettamente rispetto al comportamento (sebbene anche la 
fisiologia possa essere più libera di quanto non si supponga 
comunemente; si vedano lavori recenti come quelli di 
Gilbert e Epel 2009 o Piersma e van Gils 2010). «Il 
comportamento è il risultato di un complesso, e mal 
compreso, insieme di computazioni eseguite dal sistema 
nervoso e sembra essenziale scomporre il problema in due 
parti: una riguarda la questione della specificazione 
genetica del sistema nervoso e l’altra riguarda il modo in 
cui i sistemi nervosi funzionano nella produzione del 


comportamento» (Brenner 1974, p. 72). Il problema è 
ancora piu complesso di quanto Brenner poteva sapere. 
Egli scriveva prima che venissero sviluppate la evo-devo o 
la teoria della costruzione della nicchia - e cioè prima che 
si comprendesse la plasticità genetica e prima che ci si 
rendesse conto che anche il comportamento ha dei gradi di 
libertà. I comportamenti non sono determinati 
primariamente da fattori intrinseci dell'organismo, ma da 
esigenze della nicchia che una specie occupa. 

In altre parole, i comportamenti delle specie sono in 
realtà fatti su misura non per adattarsi all'ambiente nel suo 
complesso, ma per adattarsi alla Umwelt - e cioè a quegli 
aspetti dell'ambiente con i quali certe specie interagiscono 
in maniera diretta (Uexkull 1910, 1926). Dato il grado in 
cui i fattori ambientali possono influenzare l’espressione 
genica, come mostra la evo-devo, ci si potrebbe attendere 
che le componenti complesse dei nuovi tratti si siano 
sviluppate in loco, nel corso dello sviluppo di quei tratti. Di 
certo, non ci si aspetterebbe che tali componenti siano 
state passate, come dei testimoni, da una specie all’altra, 
già pronte all'uso o per lo meno suscettibili di pochi 
miglioramenti. Eppure, questo è proprio quello che 
presuppongono sia l'approccio in termini di caratteristiche 
componenti sia quello primato-centrico. 

Chi critica l’attenzione rivolta ai primati e ai precursori 
viene spesso accusato sia di «assumere la posizione 
tipicamente cartesiana secondo cui il linguaggio è speciale, 
nel senso che tutti i suoi attributi si trovano soltanto negli 
esseri umani», sia di sostenere che i segnali degli animali 
siano «semplicemente un modo per manifestare degli stati 
emotivi», prodotti in maniera «riflessa e involontaria» 
(Evans et al. 1993, p. 315). Nessuna delle due accuse 
regge, in questo caso. Qualsiasi tesi secondo cui «tutti gli 
attributi [del linguaggio] si trovano soltanto negli esseri 
umani» sarebbe da considerarsi assurda, se qualcuno la 
proponesse davvero. Tutto ciò che la posizione anti- 


precursori sostiene è che la presenza in altre specie di 
fenomeni simili ad alcuni riscontrati nel linguaggio non 
dice nulla di significativo su come il linguaggio si sia 
evoluto negli esseri umani; né l’unicità (o altro) del 
linguaggio ha alcuna connessione con la credenza che i 
segnali degli animali siano delle espressioni involontarie di 
emozioni - che si sa essere falso almeno da Cheney e 
Seyfarth (1990) in avanti. Io respingo l’approccio che si 
concentra sui primati e sui precursori non perché minacci 
l'unicità umana, ma proprio per la ragione opposta: perché 
l’afferma di nascosto. Proprio come l'approccio in termini 
di caratteristiche componenti, esso considera umani e non 
umani in modi molto diversi. 

Il trattamento dei comportamenti non umani come 
precursori di quelli umani è stato ben descritto da Rendell 
et al. (2009, p. 238), i quali, passando in rassegna le varie 
comparazioni tra linguaggio e comunicazione animale, 
affermano: «Sebbene i costrutti linguistici e informazionali 
definiti in maniera approssimativa siano un'utile scorciatoia 
esplicativa, essi diventano problematici quando si tratta di 
andare al di là della metafora e utilizzarli per dare una 
reale spiegazione dell’ampia gamma dei fenomeni della 
segnalazione negli animali». In realtà, la comunicazione 
animale è progettata in primo luogo per influenzare il 
comportamento e non per dare informazioni (Krebs e 
Dawkins 1984). Lungi dall'essere «una dichiarazione della 
discontinuità evolutiva», la critica mossa da Rendell et al. è 
proprio l’opposto: essa è motivata dal fatto che «le 
caratteristiche della segnalazione in un gruppo di specie 
vengono abitualmente testate come possibili proprietà di 
tipo linguistico, ribaltando così dalla testa ai piedi il 
normale approccio evolutivo. Sarebbe come se, nel caso 
della locomozione, i meccanismi, le funzioni e l’energetica 
del bipedismo umano fossero considerati i modelli sulla 
base dei quali comprendere la condizione di quadrupede a 
partire da cui esso si è evoluto» (Owren et al. 2010, p. 762). 


Owren et al. concludono che «se i meccanismi ... sono 
fondamentalmente differenti, i parallelismi che vengono 
spesso tracciati hanno piu un valore metaforico che la 
capacità di catturare una realtà effettiva. Il nostro 
suggerimento è che si tratti più di una distrazione che di un 
beneficio per la ricerca scientifica seria» (p. 763). 

Di conseguenza, la ricerca di caratteristiche della 
comunicazione animale che prefigurino le componenti del 
linguaggio è «sia teleologica sia circolare» (Rendell et al. 
2009, p. 238) - affermazione che pare pienamente 
giustificata. Considerate le implicazioni reali 
dell’asserzione che le parole e le strutture sintattiche 
abbiano i propri «precursori» nella comunicazione animale. 
Qualcuno ha sostenuto, per esempio, che i segnali di 
allarme dei cercopitechi (Cheney e Seyfarth 1990) siano 
paragonabili alle parole. Più di recente, altri hanno 
proposto l’idea che i cercopitechi nasobianco (Arnold e 
Zuberbuhler 2006) producano dei proferimenti dotati di 
una struttura simil-sintattica (o per lo meno combinatoria). 
I ricercatori che propongono o appoggiano queste tesi (per 
esempio, Hurford 2007a; Kenneally 2007) guardano agli 
animali non come a un fenomeno a sé stante, ma come a 
degli indicatori del grado al quale le altre specie anticipano 
certi aspetti del linguaggio umano. È come se il linguaggio 
rappresentasse una sorta di apice adattivo, che gli altri 
animali si sono sforzati di raggiungere, senza però riuscirci. 
Di nuovo, inevitabilmente, tutto questo suggerisce l’idea 
della scala naturae o della Grande Catena dell’Essere, la 
struttura piramidale voluta da Dio, che costituiva 
l’immagine prevalente della natura prima che Darwin la 
cambiasse per sempre. L'ironia sta nel fatto che coloro che 
vanno alla ricerca dei «precursori del linguaggio» credono 
davvero di stare riducendo la distanza tra esseri umani e 
altre specie. 


PRIMATI E PRESSIONI 


Abbiamo visto due tipi di approcci all’evoluzione umana 
che trattano umani e non-umani in maniera differente. 
Purtroppo, ne esiste almeno un altro. La cosa bizzarra é 
che quest’ultimo rende unici gli esseri umani di fatto 
negandogli un ruolo qualsiasi nella loro stessa evoluzione. 

Come si è detto in precedenza, molti libri sull’evoluzione 
del linguaggio non tentano di integrare quest’ultimo 
all’interno del processo generale dell'evoluzione umana, 
sebbene l’evoluzione del linguaggio sia una parte 
essenziale - la più importante, come sostengo in queste 
pagine - di quel processo. O si ignorano del tutto gli 
antenati ominidi oppure l’evoluzione umana e quella del 
linguaggio vengono trattate come due questioni 
completamente separate. Ecco un esempio del primo 
approccio: in un lavoro di quasi quattrocento pagine, 
Hurford (2007a) ne dedica una soltanto al dimorfismo 
sessuale negli australopitechi e fa un paio di osservazioni a 
latere su Homo habilis e Homo erectus (entrambe 
compaiono all’interno di citazioni da altri autori). Ecco, 
invece, un esempio del secondo approccio: Fitch (2010) 
dedica agli antenati degli esseri umani tre capitoli per un 
totale di poco meno di cento pagine (partendo dagli 
organismi monocellulari), di cui quasi cinquanta trattano 
dei nostri antenati più recenti. Ma uno dei capitoli 
(significativamente intitolato «Paleontologia e archeologia 
degli ominidi» e non comportamento degli ominidi!) si 
limita quasi per intero al solito resoconto da manuale di 
paleontologia in termini di «ossa e pietre» - la versione di 
Fitch sui primi stadi del linguaggio arriverà solo 170 pagine 
più tardi. Non ci sono riferimenti incrociati con il suo 
capitolo sugli ominidi, né c’è alcun tentativo serio di 
fondare nei comportamenti specifici degli antenati degli 
esseri umani la sua ipotesi di un «proto-linguaggio 
musicale». 


Forse, però, il modo più incisivo per mostrare fino a che 
punto, nella letteratura sull'evoluzione del linguaggio, gli 
antenati degli esseri umani siano stati oscurati a favore 
delle altre specie di primati è questo: proporre, sulla base 
dell'indice analitico di un campione rappresentativo di 
questo tipo di libri, un confronto tra il numero totale delle 
pagine che fanno riferimento alle specie antenate estinte e 
quello delle pagine che si riferiscono ai primati viventi. 
Come mostra la tabella 3.1, i lavori sull'evoluzione del 
linguaggio dedicano in media ai parenti dei primati viventi 
che non hanno sviluppato il linguaggio un numero di pagine 
di oltre cinque volte superiore rispetto alle pagine dedicate 
a specie che annoverano quella che ha effettivamente 
sviluppato il linguaggio. 





Ominidi (O) primate (AP) nia 
Aitchison (1996) 11 31 1:3 
Deacon (1997) 37 117 1:1,75 
Burling (2005) 17 74 1:4,3 
Kenneally (2007) 40 217 1:5,5 
Hurford (2007a) 8 180 1:22,5 
Totale 143 619 1:5,3 





Tabella 3.1. Numero delle pagine dedicate agli ominidi rispetto a quelle che 
fanno riferimento ad altri primati negli studi sull’evoluzione del linguaggio. 


Come spiegare una disparita tanto sorprendente? La 
risposta ovvia è questa: «Be’, sappiamo relativamente poco 
degli antenati degli esseri umani, i quali non possono più 
essere studiati direttamente, mentre sappiamo molto di più 
sui primati viventi, che invece possono essere studiati 
direttamente; e in virtù del loro alto grado di somiglianza 
genetica con gli umani, possiamo legittimamente usarli 
come modello per i pre-umani». In altre parole, si tratta del 
classico caso in cui si cercano le chiavi della macchina nei 
punti illuminati dai lampioni. 


Usare i comportamenti dei primati moderni come base 
per il successivo sviluppo degli ominidi ci obbliga a 
guardare a qualsiasi processo abbia portato al linguaggio 
soltanto come a un aumento quantitativo nei tratti gia 
posseduti da quelli. Molti vedono tutto ciò come qualcosa di 
naturale e di desiderabile. Nella prefazione a un recente 
volume sulla relazione tra umani e altri primati (Kappeler e 
Silk 2010, p. V), i curatori affermano - come se stessero 
asserendo un fatto e non argomentando - che «gli studi 
comparativi condotti sui nostri parenti biologici più stretti, i 
primati non umani, ci forniscono sia i fondamenti logici per 
identificare degli universali umani sia le evidenze a favore 
della continuità evolutiva nel nostro comportamento 
sociale». Tuttavia questo modo di vedere le cose - assai in 
voga oggi - è per molti versi nocivo. In primo luogo, butta 
via più di cinque milioni di anni di sviluppo evolutivo della 
linea che ha condotto direttamente a Homo sapiens, 
assumendo senza argomentare che in quell’intervallo di 
tempo non possa essere accaduto nulla di significativo. In 
secondo luogo, per quanto miri a ridurre l’«unicità» degli 
esseri umani e a rimarcare la continuità con le altre specie, 
tratta le scimmie non come degli animali ben adattati e a sé 
stanti, ma come degli esseri umani incompleti - degli 
organismi che vivono all’«ombra dell’uomo», per utilizzare 
un'espressione rivelatrice di Jane Goodall (1971). In terzo 
luogo riduce drasticamente la nostra capacità di rispondere 
a una domanda-chiave nell'evoluzione del linguaggio: 
perché proprio gli esseri umani (e nessun'altra specie) 
hanno sviluppato il linguaggio? 

Più sono i precursori e le caratteristiche componenti che 
scopriamo in altre specie, più diventa difficile rispondere a 
questa domanda. Come si è detto in precedenza, 
indipendentemente dallo scenario che si sceglie, a un certo 
punto la selezione naturale deve entrare in gioco. Persino la 
mutazione prometeica di cui parla Chomsky (2010) non 
sarebbe mai divenuta stabile, se i discendenti di Prometeo 


non fossero entrati in competizione con membri di altre 
comunita. Ma scegliere le moderne scimmie come modello 
per gli antichi esseri umani restringe le possibili pressioni 
selettive cruciali a quelle che avrebbero colpito anche altre 
scimmie. 

La quantita e la varieta di pressioni che si sono ipotizzate 
(Johansson 2005 ne indica una dozzina, dall’uso degli 
utensili e la caccia all’intelligenza sociale e alla scelta della 
femmina) dovrebbero gia di per sé bastare a far sorgere dei 
sospetti. Nessuna spicca tra le altre; nessuna ha dalla sua 
più elementi probanti rispetto alle altre. Nessuna è più di 
un'ipotesi dell'ultima ora, un disperato tentativo di fare una 
qualche proposta, a fronte della presunta mancanza di 
evidenze e dell’estrema difficoltà del problema, dato questo 
presunto fatto. Tuttavia nessuna di queste teorie supera la 
prova di un semplice esperimento mentale. Tenete presente 
che il comportamento (proto) linguistico ha dovuto dare dei 
risultati fin dai primissimi proferimenti, in caso contrario la 
sua infrastruttura genetica non sarebbe mai divenuta 
stabile. Perciò, data la pressione selettiva che preferite, 
considerate quali avrebbero potuto essere quei primi 
proferimenti e se essi avrebbero potuto essere 
sufficientemente utili per venire conservati e incrementati. 

Si noti che, sebbene questo possa suonare come chiedere 
«quali sono state le prime parole?», in realtà non si tratta 
della stessa cosa. La domanda mira semplicemente a 
scoprire se, data una certa pressione selettiva, sarebbe 
stato possibile produrre dei proferimenti in qualche modo 
rilevanti per rispondere a quella pressione. Prendete 
l'ipotesi chiamata «grooming e gossip» proposta da Dunbar 
(1996). Quest'ultima soddisfa almeno la condizione di 
unicità degli umani, poiché sostiene che un aumento nella 
dimensione del gruppo avvenuto tra gli antenati degli 
umani rese la pratica del grooming al proprio partner 
troppo dispendiosa in termini di tempo e causò quindi la 
sostituzione di quel comportamento con un altro: la 


condivisione di pezzi di informazione contenenti particolari 
pruriginosi riguardanti gli altri membri del gruppo. 
Veicolare queste informazioni avrebbe richiesto non 
soltanto dei segni per indicare dei particolari membri del 
gruppo (niente di che: lo sanno fare anche i delfini; si veda 
Janik et al. 2006), ma anche dei segni per indicare le 
interazioni tra membri del gruppo. Proferimenti quali «X ha 
combattuto con/fatto sesso con/rubato cibo a Y» richiedono 
non solo dei verbi - molto più sfuggenti da un punto di vista 
del significato rispetto ai nomi, e quindi raramente 
riscontrati tra le prime cinquanta parole apprese dai 
bambini -, ma anche abbastanza sintassi per distinguere «X 
ha fatto Y a Z» da «Z ha fatto Y a X». Nulla di tutto ciò 
sarebbe stato disponibile prima che il linguaggio 
raggiungesse un considerevole livello di sviluppo. In altre 
parole, i primissimi stadi del linguaggio non potrebbero 
avere espresso nessun gossip minimamente interessante; e 
considerato che qualche altra forza avrebbe dovuto guidare 
quelle fasi, la sostituzione del grooming con il gossip non 
può essere stata la pressione selettiva alla base dell’origine 
del linguaggio. 

l'effettiva realizzabilità dei primi proferimenti non è 
l’unico esperimento mentale che si può usare per valutare 
le ipotesi di pressione selettiva. Se ne possono trovare altri 
quattro nell’articolo di Szamado e Szathmary (2006), nel 
quale vengono prese in esame undici ipotesi, ciascuna delle 
quali fallisce almeno uno dei test. Tuttavia c’è 
un’argomentazione più solida per rigettare le ipotesi circa 
le pressioni che avrebbero inciso sulle altre specie. Nei casi 
in cui non è coinvolta la specie umana, si assume (e lo 
fanno anche quanti riservano agli esseri umani un 
trattamento speciale) che i nuovi tratti sorgano in risposta 
ai nuovi problemi affrontati da una certa specie. Per 
esempio, Hauser (1996, p. 154) si chiede: «Quali sono i 
problemi speciali che i pipistrelli si trovano di fronte nel 
proprio ambiente e che potrebbero aver condotto alla 


selezione dell’ecolocazione?» (corsivo mio). Egli non 
discute le ragioni alla base di questa domanda. Al 
contrario, sembra ritenere autoevidente che questo sia ciò 
che avviene di fronte a un nuovo fenomeno di adattamento. 
In effetti, ho già citato un caso (Hauser et al. 2007, p. 108) 
in cui egli esplicitamente definisce il criterio dei «problemi 
speciali» come strategia generale di ricerca. Eppure, 
quando il tema è il linguaggio e non l’ecolocazione, come in 
Hauser et al. (2002), non si fa menzione alcuna di un 
qualche «problema speciale» cui attribuire la 
responsabilità della selezione del linguaggio. 

La forza di questa obiezione apparirà ancora maggiore 
quando considereremo la teoria della costruzione della 
nicchia (si veda più avanti). Diventerà allora più chiaro 
perché i nuovi adattamenti possano sorgere soltanto 
attraverso la necessità di fronteggiare certi «problemi 
speciali». I ricercatori che si concentrano sulle pressioni a 
cui sono state soggette le altre scimmie possono credere di 
stare rispettando i princìpi evolutivi di gradualità e 
continuità, ma così facendo, in realtà, non rispettano alcuni 
dei fatti più essenziali sull'evoluzione. Uno è che la 
variabilità genetica, sulla base della quale funziona 
l'evoluzione - e senza la quale l'evoluzione non ci sarebbe 
-, esiste principalmente perché gli organismi vivono in una 
varietà di ambienti ampia e contano su un’ampia varietà di 
nutrimenti che si procurano in molti modi diversi. Un altro 
è che la natura degli ambienti, quella del nutrimento 
disponibile e quella dei mezzi per procurarselo sono 
soggette a cambiamenti costanti, e le risposte degli 
organismi a questi cambiamenti sono il motore 
dell'evoluzione - un motore senza il quale la vita si sarebbe 
difficilmente sviluppata al di là dei batteri. E per quanto 
non conosciamo gli antenati degli umani quanto vorremmo, 
ciò che sappiamo è comunque abbastanza per mostrare che 
i loro ambienti e il loro modo di esplorarli erano molto 
diversi da tutto ciò che sia stato trovato nei primati. 


LA TEORIA DELLA COSTRUZIONE DELLA NICCHIA 


La evo-devo non è l’unico nuovo sviluppo nella biologia 
del ventunesimo secolo. Altrettanto importante è la teoria 
della costruzione della nicchia (Odling-Smee et al. 2003; 
Laland e Sterelny 2006; Laland et al. 2008). 

I propugnatori di questa teoria sostengono che il neo- 
darwinismo classico (Mayr 1963; Williams 1966; Ayala e 
Dobzhansky 1974) diminuisca in maniera indebita il ruolo 
che gli stessi organismi che evolvono giocano 
nell'evoluzione. Dalle alghe di stagno in su, gli organismi 
viventi sono parte attiva nel causare dei cambiamenti nel 
proprio ambiente aggiungendo, sottraendo o modificandone 
vari aspetti. 

Tutti (creazionisti inclusi) accettano che se l’ambiente 
cambia, gli animali si adatteranno a quei cambiamenti. 
Secondo alcuni noti evoluzionisti, la storia finisce qui: 
«L'adattamento è sempre asimmetrico; sono gli organismi a 
adattarsi al proprio ambiente e mai viceversa» (Williams 
1992, p. 484). E in molti casi gli organismi si adattano 
effettivamente all'ambiente nel quale si ritrovano. Spesso, 
però, quell’ambiente viene alterato radicalmente, per 
esempio da un cambiamento climatico brusco e forte 
oppure dall’emergere di nuovi predatori. Gli organismi 
hanno allora tre opzioni: si possono estinguere, si possono 
adattare alle nuove condizioni o possono muoversi in una 
nuova nicchia. (Si noti che sebbene l’ultima opzione spesso 
comprenda lo spostamento in un nuovo territorio, non è per 
forza così: i membri della specie interessata possono 
rimanere nello stesso territorio modificando il modo di 
sfruttarlo tramite cambiamenti in ciò che mangiano o nel 
modo di procurarsi il cibo). 

La terza alternativa è stata scelta più volte nel corso 
dell'evoluzione. Gli animali acquatici si sono spostati sulla 
terraferma. Quelli terrestri sono tornati nell'acqua. Le 
specie che abitavano in superficie si sono spostate in cima 


agli alberi oppure sottoterra. In ogni caso, il semplice 
spostamento cambia le pressioni evolutive a cui gli animali 
sono soggetti. E a questo punto che gli interessi della teoria 
della costruzione della nicchia iniziano a sovrapporsi a 
quelli della evo-devo (Laland et al. 2008), dal momento che 
la plasticità dei fattori genetici da poco compresa è 
precisamente ciò che rende un organismo capace di 
adattarsi rapidamente alle nuove condizioni. Si innesca così 
un effetto feedback in virtù del quale un organismo e una 
nicchia agiscono luno sull’altra in maniera reciproca e 
simultanea: l'organismo trasforma la nicchia e la nicchia, a 
sua volta, trasforma l'organismo, finché tra i due non si 
raggiunge una corrispondenza quasi perfetta (o per lo 
meno «sufficientemente buona») - proprio quel genere di 
corrispondenza che porta i creazionisti a ipotizzare 
l’esistenza di un Creatore. 

Per esempio, l'adattamento di una specie in precedenza 
terrestre a una vita per lo più acquatica che prevedeva la 
costruzione di dighe non ha richiesto al castoro di mettere 
insieme il necessario (denti, occhi, artigli, pelliccia, coda e 
così via) prima di avventurarsi nell’acqua. Al contrario, 
sembrerebbe che gli occhi dei castori siano tanto unici 
quanto oltremodo ben adattati alla nicchia da loro stessi 
costruita. In altre parole, i nuovi adattamenti sono 
tipicamente il risultato non di un accumulo di componenti 
preesistenti, ma dell’evoluzione in loco di un insieme di 
componenti che, per quanto possano avere degli analoghi 
nelle altre specie, sono il prodotto dell’interazione tra un 
particolare organismo e una particolare nicchia. 

Si noti che la teoria della costruzione della nicchia 
contribuisce tra l’altro a ridurre drasticamente le apparenti 
differenze tra umani e non-umani. Prima di esaminare le 
connessioni tra costruzione della nicchia e speciazione, 
vale la pena di dare un'occhiata veloce a una di queste - 
quella cosa che chiamiamo «cultura». Si tratta di un 
termine usato con vari significati, alcuni dei quali 


(«raffinate e sofisticate opere d’arte e dell’intelletto», 
«schemi di comportamento basati sulla capacità 
simbolica») ne circoscrivono effettivamente l’uso alla sola 
specie umana. Probabilmente, molti all’interno delle 
scienze del comportamento sarebbero d’accordo con una 
definizione come «comportamenti che variano tra gruppi 
della stessa specie e sono stati appresi socialmente». 
Definizioni di questo genere hanno permesso che si 
parlasse di «cultura» in riferimento a molte specie (Bonner 
1983; Avital e Jablonka 2000), ma in particolar modo alle 
scimmie (Wrangham 1995; Byrne 2007). Comunque la 
disparità tra il numero e la diversità delle pratiche culturali 
negli esseri umani e la loro rarità e scarsezza nelle altre 
specie fa apparire questo uso come un disperato tentativo 
di essere politically correct piuttosto che uno sforzo 
genuino di stabilire una continuità nel processo evolutivo. 

Tuttavia, se invece di chiamarli «cultura» guardiamo 
all'intero arco dei comportamenti umani variabili 
semplicemente come a un esempio di costruzione della 
nicchia, allora possiamo collocare gli esseri umani 
all’interno di un continuum che li connette a molte altre 
specie, tra le quali alcune, come le termiti, assai lontane da 
un punto di vista filogenetico (Abe et al. 2000). Formiche e 
termiti hanno costruito nicchie elaborate; gli esseri umani 
hanno sviluppato una nicchia ancor più elaborata e, 
dandole il nome di «cultura», hanno messo in campo un 
ulteriore meccanismo per apparire speciali. 

Si potrebbe obiettare che ridurre la cultura a prodotto 
della costruzione di una nicchia non sia legittimo, perché la 
cultura umana, a differenza di quello che avviene nelle 
altre specie, comprende comportamenti appresi. Ma a 
questo si può rispondere in molti modi. In primo luogo, 
come si è già detto, non c’è una ragione fondata per 
privilegiare l'apprendimento sull’istinto - a volte viene la 
tentazione di credere che si assuma una sua qualche 
superiorità morale. In secondo luogo la costruzione della 


nicchia non può coinvolgere comportamenti istintivi basati 
sulla genetica. La vera novità di una nicchia appena creata 
(e cioè il suo essere nuova per la specie che la costruisce) 
garantisce che i suoi creatori non hanno ancora nessun 
adattamento speciale a essa. Nuove nicchie possono essere 
sviluppate solo attraverso dei comportamenti per i quali 
non c’è un istinto precedente - dei comportamenti che 
devono essere inventati e devono passare 
dall’apprendimento, prima di poter innescare le pressioni 
adattive che, alla fine, assicureranno a essi un posto nel 
genoma. In terzo luogo, ricordate che praticamente tutta la 
cultura umana dipende dal possesso di un’unica facoltà, la 
facoltà del linguaggio, il cui funzionamento è tanto lontano 
dalla consapevolezza cosciente e dal controllo della volontà 
quanto qualsiasi comportamento «istintivo» nelle altre 
specie. In altri termini, tutta la nostra elaborata e 
«appresa» «cultura» si fonda sull’istinto proprio come la 
costruzione delle dighe da parte dei castori o la 
coltivazione dei funghi da parte delle formiche. 

Dati questi fatti, è tanto inappropriato per gli umani 
vantarsi quanto per quella mosca che, appoggiata sulla 
ruota di un carro, esclama: «Guarda quanta polvere 
sollevo!». Infatti, senza la costruzione di una nicchia, la 
nostra specie non avrebbe mai potuto esistere. 


LA COSTRUZIONE DELLA NICCHIA 
E LA SPECIAZIONE OMINIDE 


«Una delle ironie della storia della biologia è che 
nell’Origine delle specie Darwin non spiegò in realtà 
l’origine di nuove specie, perché non sapeva come definire 
la specie. L'origine delle specie si occupa in effetti del modo 
in cui una specie può mutare nel corso del tempo, non del 
modo in cui una specie può proliferare in molte» (Futuyma 
1983, p. 152 [trad. it. pp. 205-206]). È difficile scorgere, 
sotto il velo della mescolanza genetica che Darwin assunse 


come risultato dell’accoppiamento selettivo, in che modo 
potesse avere luogo la speciazione. La ricerca di Mendel 
cambio radicalmente il quadro e la teoria della speciazione 
è ora un campo di studi ben esplorato. 

La speciazione può essere allopatrica (due gruppi della 
stessa specie si separano fisicamente) o simpatrica 
(entrambi i gruppi continuano ad abitare lo stesso 
territorio). Qui ci interesseremo solo della speciazione 
simpatrica (Maynard Smith 1966; Dieckmann e Doebeli 
1999; Higashi et al. 1999; Gavrilets e Waxman 2002). Non 
sorprende che gran parte della speciazione sia allopatrica, 
ma ci sono buone ragioni per ritenere che la speciazione 
ominide sia stata primariamente (se non del tutto) 
simpatrica (Summers e Neville 1978). 

Se si guarda una mappa dei siti archeologici nell’ Africa 
orientale, in particolare la Rift Valley, si nota come i siti 
associati a specie differenti nel lignaggio umano formino 
degli agglomerati, a conferma che specie differenti 
condivisero le stesse aree per parecchi milioni di anni. 
Inoltre ritrovamenti recenti indicano che Homo habilis e 
Homo erectus (specie ritenute in precedenza una antenata 
dell’altra) hanno in realtà convissuto forse per un milione di 
anni (Spoor et al. 2007). Ci possono essere molte cause 
dietro la speciazione simpatrica, ma alcune delle più 
potenti sono legate a un differente sfruttamento delle 
risorse: o si usano risorse diverse oppure la stessa risorsa 
si ottiene tramite mezzi diversi e/o viene sfruttata in 
maniera differente (si vedano le fonti citate prima). Una 
modificazione nello sfruttamento delle risorse si riscontra 
di frequente nel contesto della costruzione della nicchia, 
quando un organismo entra in una nicchia preesistente 
(Kawata 2002) oppure cerca in maniera attiva di crearne 
una nuova (Beltman et al. 2004). Nel secondo caso, «la 
colonizzazione di una nuova nicchia è il primo passo verso 
la speciazione ... come risultato della selezione per 


adattamento al nuovo ambiente» (Beltman et al. 2004, p. 
36). 

Fatto il primo passo, in genere il progresso continua nelle 
fasi successive della speciazione, fino al punto in cui 
l’ibridazione diviene estremamente rara o impossibile. Nel 
frattempo la specie e la nicchia raggiungono in genere un 
buon livello di adattamento reciproco e i cambiamenti 
successivi sono sporadici e di solito di piccola entità. 
Laland et al. (1999) sono stati forse tra i primi a notare 
l'intima connessione fra costruzione della nicchia ed 
equilibrio punteggiato (Eldredge e Gould 1972). Eldredge e 
Gould hanno osservato come un tipico dato che emerge 
dalle testimonianze paleontologiche sia che nuove specie 
appaiono relativamente all'improvviso e persistono poi con 
pochi (o senza) cambiamenti per periodi di tempo piuttosto 
lunghi. Questa proposta è stata attaccata da gradualisti 
come Dawkins (1986), il quale ha controproposto il 
concetto di «velocità variabile». Nessuna delle due fazioni 
in campo ha però mai spiegato perché dovrebbe esistere o 
l’«equilibrio punteggiato» o la «velocità variabile». 

I fatti supportano di per sé più la tesi di Eldredge e Gould 
(1972) di quella di Dawkins (1986), e la costruzione della 
nicchia spiega il motivo. Quando entra in una nuova 
nicchia, una specie deve adattarsi rapidamente, ma una 
volta che la nicchia si sia sviluppata non c’è l’impellenza di 
ulteriori cambiamenti - a meno che non intervenga una 
qualche modificazione drastica nell'ambiente, nel qual caso 
un altro evento di speciazione diventa possibile. Il capitolo 
4 affronta questo tema nel contesto di un esame più 
dettagliato della speciazione ominide. Per il momento basti 
notare che è probabile che le novità evolutive emergano nei 
primi stadi della speciazione piuttosto che durante la 
costruzione di una nuova nicchia. Le ragioni di questo 
risulteranno più chiare nel corso della prossima sezione. 


ALCUNE LINEE-GUIDA PER LO STUDIO 
DELLEVOLUZIONE DEL LINGUAGGIO 


Ho criticato ampiamente il modo in cui Hauser e i suoi 
collaboratori hanno approcciato questo tema. Va tuttavia 
riconosciuto che il loro lavoro contiene due suggerimenti 
importanti (che però loro non seguono); presi insieme, essi 
ci aiuteranno a trovare la direzione giusta. 

Il primo suggerimento si trova in Hauser et al. (2002, p. 
1572) ed è la rivendicazione dell’«estensione del metodo 
comparativo a tutti i vertebrati e forse anche oltre» 
(corsivo mio). Il secondo, già citato ed essenziale per 
supportare il primo, sposta la nostra attenzione sui «modi 
in cui delle specie anche molto distanti fra loro, dato un 
insieme di vincoli, possano avere problemi ecologici o 
sociali comuni, tali da generare pressioni selettive comuni 
e, in ultima istanza, soluzioni comuni» (Hauser et al. 2007, 
p. 108, corsivo mio). Si noti che ciò che ho criticato come 
abuso del metodo comparativo riguarda soltanto la ricerca 
di «precursori» o di «caratteristiche componenti». La 
ricerca di «problemi comuni» e di «pressioni selettive 
comuni» è una faccenda completamente diversa, dal 
momento che si concentra sulle somiglianze tra nicchie 
sviluppate da specie diverse piuttosto che sui tratti 
sviluppati da una specie per adattarsi meglio alla propria 
nicchia particolare. Inoltre si focalizza sulla convergenza 
evolutiva (Conway Morris 2003): il fatto che sembri esserci 
un numero limitato di soluzioni a un problema evolutivo. Le 
buone soluzioni a un determinato problema tenderanno 
dunque a ripetersi, indipendentemente dal fatto che tra le 
specie vi siano grandi differenze. Queste causeranno 
senz'altro una varianza nei mezzi specifici per il 
raggiungimento di una particolare soluzione, ma questo è 
proprio quello che ci si aspetta. La distanza filogenetica 
non rappresenta più quel motivo di imbarazzo che Mithen 
(2005) e altri paventavano. 


Seguire questi due suggerimenti ci svincola dall’obbligo 
di prendere in considerazione il comportamento degli altri 
primati. Se gli altri primati avessero affrontato «problemi 
sociali o ecologici» simili a quelli degli antenati degli esseri 
umani, avrebbero probabilmente cercato delle soluzioni 
simili. Se il problema comune avesse avuto in qualche 
modo a che fare con la comunicazione, le loro risposte e le 
nostre avrebbero implicato entrambe un qualche 
cambiamento nei modi della comunicazione. Ma non c’è la 
benché minima traccia del fatto che gli schemi della 
comunicazione tra le scimmie siano in qualche modo 
cambiati da quando il lignaggio delle scimmie e quello degli 
uomini si sono separati - e certo non in modi che puntino 
nella direzione del linguaggio. Questo indica chiaramente 
che dovremmo smetterla di usare le scimmie come modello 
per comprendere l'evoluzione umana. Dovremmo invece 
guardare alla storia dei nostri antenati più vicini, per 
individuare un problema che fu soltanto loro e che si 
trovarono ad affrontare in un'epoca successiva a quella 
degli ultimi antenati comuni tra esseri umani e scimpanzé. 

In seguito dovremo affrontare le conseguenze 
dell’assunzione suggerita nel capitolo 1, che potremmo cioè 
avere a che fare non con un singolo processo («l'evoluzione 
del linguaggio»), ma con due o più processi distinti, di cui il 
linguaggio fu solo il prodotto finale. Dovremo andare alla 
ricerca di un processo che abbia allontanato la 
comunicazione umana dai segnali legati agli stimoli tipici 
degli altri animali, per condurla alle porte di quel mondo 
libero da stimoli dischiuso dal linguaggio. Questo compito 
sarebbe stato più semplice quando, per descrivere il 
problema, si usava l’espressione «origine del linguaggio». 
La sua riformulazione in termini di «evoluzione del 
linguaggio» sembra in qualche modo aver già spostato il 
fuoco dell’interesse lontano dai primissimi stadi. Per 
esempio, scrive Hurford (2007a, p. 333): «Non appena il 
passo fu compiuto e gli animali riuscirono a comunicare i 


loro pensieri agli altri in maniera abbastanza libera, a 
cascata [sic] furono selezionate altre innovazioni». Non ci 
viene detto quale fu quel passo, né quando, come o perché 
esso ebbe luogo, né quali innovazioni erano contenute nella 
cascata. 

Certamente, si potrebbe sostenere che non essersi 
focalizzati sulle origini, insieme alla difficoltà intrinseca 
dell'argomento, spieghi perché la domanda sull’evoluzione 
del linguaggio sia divenuta «il problema più arduo della 
scienza» (Christiansen e Kirby 2003, p. 1). Anche se 
l'evoluzione del linguaggio fosse stata un processo unico, 
ogni processo deve avere un inizio; e quando si capisce 
come il processo è iniziato, diventa relativamente semplice 
comprenderne gli stadi successivi. Il mantra spesso 
ripetuto, secondo cui l’origine del linguaggio non può 
essere ricondotta a una singola causa ma alla combinazione 
di molti fattori diversi, va nella direzione di spiegare perché 
il problema sia divenuto apparentemente intrattabile. 
Nessuno nega che molte cose dovettero realizzarsi prima 
che una qualsiasi specie potesse aspirare al linguaggio, né 
che, a un qualche livello, nell’emergenza del linguaggio 
furono coinvolti molti fattori. Per quanto vere, sono 
considerazioni in fondo inutili: ci consegnano una lunga 
lista di possibili fattori, senza indicare come valutarne 
l’importanza relativa e senza darci gli strumenti per 
stabilire l’ordine secondo il quale essi sono diventati 
operativi. Non sorprende che il problema sia parso arduo. 
Ma indipendentemente dal numero dei fattori in gioco, essi 
devono essere intervenuti in una qualche sequenza 
particolare, che soltanto una ricostruzione accurata dei 
primissimi stadi del processo di avvicinamento al 
linguaggio può rivelare. 

Di conseguenza, la ricerca dovrebbe cominciare 
considerando le circostanze che potrebbero aver condotto 
gli antenati degli esseri umani oltre i limiti imposti dalla 
comunicazione animale. Dovremmo diffidare di qualsiasi 


teoria sostenga che alcuni fattori interni, come la 
mutazione genetica, potrebbero essere una condizione 
sufficiente per far emergere una qualche novità evolutiva. 

Le novità evolutive significative non sono il risultato di 
cambiamenti spontanei nell'organismo. Al contrario, come 
mostra la teoria della costruzione della nicchia esse 
sopraggiungono quando i cambiamenti nel comportamento 
sono determinati dall’adattamento a una nicchia 
particolare. Prendete un altro esempio ovvio: l'origine del 
volo degli uccelli. Sono state proposte almeno quattro 
teorie (Zhou 2004). La teoria cursoriale sostiene che gli 
antenati degli uccelli corressero sempre più veloce e 
facessero salti sempre più lunghi. La teoria arborea 
sostiene che essi saltassero di ramo in ramo, da ultimo 
planando, come i moderni scoiattoli volanti. Teorie 
moderne più sofisticate sostengono o che fossero dei 
predatori, che dai rami si avventavano sulla preda che si 
trovava a terra (Garner et al. 1999), oppure che facessero 
nidi a terra ma di notte si ritirassero sui rami vicini, 
tuffandosi giù in soccorso delle uova o dei piccoli se erano 
in pericolo (Kavanau 2007). Per quanto diverse, queste 
teorie hanno un elemento che le accomuna: concordano 
tutte sul fatto che il comportamento sia venuto prima e 
l'adattamento generico della forma lo abbia seguito. 
Nessuno ha mai suggerito che il volo sia cominciato quando 
una qualche mutazione casuale abbia iniziato a far crescere 
le ali. 

Possiamo ora specificare in maniera piuttosto precisa le 
sole condizioni alle quali il linguaggio avrebbe potuto 
svilupparsi. Alcune specie più recenti degli antenati che 
abbiamo in comune con le scimmie, e antenate dirette degli 
umani moderni, devono essersi trovate a fronteggiare un 
problema molto specifico con due caratteristiche chiare e 
indiscutibili: deve essere stato un problema che 
nessun’altra specie con capacità anche lontanamente simili 
ha affrontato e, sia che fosse «sociale» sia che fosse 


«ecologico», tale per cui la sua soluzione coinvolgeva un 
qualche genere di cambiamento, o aggiunta, nei 
comportamenti legati alla comunicazione. Naturalmente, 
l’identificazione di questo problema è ben lungi dal 
rappresentare la fine della storia. Si deve mostrare che la 
sua risoluzione avrebbe avuto effetti di vasta portata sulla 
specie che lo risolse - effetti che difficilmente avrebbero 
potuto essere previsti e di cui anche oggi i linguisti 
evolutivi non sembrano del tutto consapevoli. 


4 
DALLA COMUNICAZIONE ANIMALE 
AL PROTO-LINGUAGGIO 


Maynard Smith e Szathmary (1995) hanno considerato il 
linguaggio come l’ottava, e ultima, di una serie di 
transizioni maggiori avvenute durante l’evoluzione. Altre 
due sono la comparsa degli organismi monocellulari e 
l’origine della vita stessa - il linguaggio, insomma, è in 
buona compagnia. E chiaramente eventi di una tale portata 
non possono accadere con la stessa velocità di uno schiocco 
di dita. Al contrario, quella sull’origine della vita è una 
domanda che si scompone in molte domande diverse 
(Dyson 1999): come è iniziata la riproduzione, come è 
iniziato il metabolismo e come è iniziata la replicazione. (Si 
noti che, come spiega Dyson, riproduzione e replicazione 
sono due cose diverse). E che gli organismi multicellulari 
abbiano origini simbiotiche, coloniali o sinciziali (singole 
cellule con più nuclei), la loro comparsa è stata un processo 
che ha richiesto una serie di passaggi intermedi e si è 
protratto per un periodo considerevole (Hedges et al. 
2004). 

Perciò, se come molti ritengono la transizione da uno 
stato senza linguaggio al moderno linguaggio umano è 
stata un processo unitario, essa (non importa se graduale o 
improvvisa) è stata un tipo di sviluppo che nessun altro 
contesto evolutivo aveva mai conosciuto prima. Solo una 
spiegazione dell’evoluzione del linguaggio come serie di 
processi dinamici può evitare la trappola dell’unicità umana 
e spiegare in maniera coerente come esso si sia evoluto. 
Proprio come fa Dyson per spiegare l’inizio della vita, 
dobbiamo rispondere a tre domande - in questo caso: come 


siano state spezzate le catene della comunicazione animale, 
come il cervello abbia dato una struttura al prodotto di 
questo processo e come, pur essendoci un’unica struttura 
di base, il risultato finale non sia stata una singola lingua, 
ma migliaia di lingue. Questo capitolo cercherà di dare una 
risposta alla prima domanda. 

Quando si ha a che fare con i processi, è utile cominciare 
fissando una base di partenza. Questa dovrebbe avere due 
componenti. Ovviamente, è importante sapere da dove 
cominciare dal punto di vista della comunicazione. Ma è 
altrettanto importante conoscere che cosa ci fosse da 
comunicare - e cioè, quanto ricco (o povero) fosse lo stato 
cognitivo dei nostri antenati privi di linguaggio -, poiché la 
qualità relativa della cognizione prelinguistica deve 
sicuramente avere avuto un'influenza sull'andamento 
successivo dello sviluppo del linguaggio. Se la cognizione 
era fin dall'inizio molto ricca e comparabile in tutto e per 
tutto a quella degli umani moderni, l'andamento avrebbe 
potuto seguire una traiettoria molto breve. Se i preumani 
erano «praticamente come voi da un punto di vista 
cognitivo» (Hurford 2007a, p. 164) e disponevano di 
concetti del tutto simili a quelli degli esseri umani, allora 
(mettendo da parte per il momento sintassi e fonologia) 
tutto ciò che rimaneva da fare era trovare le etichette da 
dare a quei concetti. Se invece le loro facoltà cognitive 
erano relativamente modeste - se i nostri antenati erano in 
grado di rappresentare mentalmente solo ciò che 
comunicavano, e cioè quelli che Chomsky (2010, p. 57) 
chiama «oggetti indipendenti dalla mente o eventi nel 
mondo esterno» -, il lavoro da fare sarebbe stato molto di 
più. Il linguaggio come lo conosciamo noi dipende in 
maniera cruciale dal fatto che si possiedano già certi 
simboli per identificare non individui o occorrenze 
particolari, ma categorie generali di oggetti ed eventi - non 
«questo cane nero» o «la corsa al supermercato di venerdì 
scorso», ma semplicemente «cane» e «corsa». 


Per quanto riguarda la comunicazione, il nostro punto di 
partenza può essere l’assunzione che negli ultimi antenati 
privi di linguaggio dei moderni esseri umani fosse 
leggermente diversa da quella tra le scimmie viventi 
(Mitani 1996; Pollick e de Waal 2007). Essa sarebbe stata 
cioè composta da una dozzina (al massimo) di segnali innati 
per esprimere i desideri o le intenzioni di chi produceva il 
segnale, oppure per tentare di influenzare il 
comportamento degli altri membri della specie. Tutti i 
segnali sarebbero stati connessi in maniera inestricabile a 
certi tipi particolari di situazione e a certi particolari 
contesti di proferimento. (I segnali usati per trarre in 
inganno non fanno eccezione: affinché l'inganno funzioni, 
chi riceve il segnale deve considerare appropriati il 
contesto e la situazione). Nessun segnale sarebbe stato in 
grado di veicolare un'informazione oggettiva. 

Si potrebbe obiettare che il riferimento funzionale (già 
discusso nel capitolo 3) sia frequente nella comunicazione 
tra organismi, dai cercopitechi ai polli, proprio per 
trasmettere una qualche informazione oggettiva circa la 
presenza di predatori. Ma questa convinzione si basa 
sull’assunto che i segnali d’allarme siano in qualche modo 
dei «nomi», che stanno per i predatori da cui si sta 
mettendo in guardia qualcuno. Tipicamente, però, i segnali 
degli animali non esprimono nulla che noi potremmo 
parafrasare usando delle singole parole. Se proviamo a 
tradurli in umanese, constatiamo che le espressioni 
equivalenti più vicine sono frasi intere (normalmente 
all’imperativo): «Accoppiati con me», «Stai lontano dal mio 
territorio». Il modo migliore di rendere ciò che per i 
cercopitechi è il segnale per «aquila» è probabilmente 
qualcosa del tipo: «Attenzione, c’è un pericolo che viene 
dall’aria!» o «Veloce, corri a nasconderti tra i cespugli!». 
Ad ogni modo, come per tutti i segnali che non si limitano a 
veicolare i sentimenti provati in quel preciso istante da chi 
li produce, la funzione del segnale sarà di indirizzare il 


comportamento piuttosto che quella di informare. 
Naturalmente, nulla vieta agli animali di inferire una 
qualche informazione - in questo caso, la presenza di 
un'aquila - proprio come facciamo noi quando formuliamo 
una frase del tipo «Tutte queste nuvole significano che 
pioverà nel pomeriggio». Ma il genere di proferimenti 
caratteristici del linguaggio umano non ci costringe alla 
mera inferenza. 

Per quanto riguarda la comunicazione, la base di 
partenza non è difficile da stabilire; altra faccenda sono gli 
aspetti cognitivi. 


IL PARADOSSO DELLA COGNIZIONE 


Dopo il Watergate, una domanda ricorrente in politica è 
diventata: «Che cosa sapeva X e quando è venuto a 
saperlo?». Una preoccupazione altrettanto pressante si ha 
quando ci occupiamo delle capacità cognitive degli antenati 
degli esseri umani. In questo caso il problema è aggravato 
dal fatto che è possibile mettere insieme delle evidenze 
egualmente plausibili a favore di ciascuna delle due 
posizioni in campo. Una grande quantità di prove supporta 
la tesi che gli organismi non umani disponessero di un 
campionario di concetti ricco e complesso. Ma ce ne sono 
altrettante che supportano la tesi che lo scarto cognitivo 
tra la specie umana e quelle non umane fosse molto ampio 
e si manifestasse nelle cose che solo la prima è in grado di 
fare. Per uscire da questa situazione, apparentemente 
paradossale, soppesiamo le prove a disposizione delle due 
posizioni in campo. Nelle prossime pagine mi concentrerò 
solo sui concetti di entità concrete e nominabili. Non 
considererò i concetti relazionali più astratti, come 
l'opposizione stesso/diverso, anche se alcuni di questi 
suggeriscono che molti mammiferi siano dotati di capacità 
concettuali impressionanti. Quello che ci interessa qui è 


l’eventuale possesso di quei concetti che possono, almeno 
potenzialmente, essere rappresentati tramite parole. 


Prove a favore della cognizione avanzata 


Secondo molti, una delle ragioni più forti a favore della 
cognizione avanzata nei preumani è l’evoluzione stessa. 
Costoro vedono la «discendenza con modificazioni» - il 
modo in cui a Darwin piaceva chiamare l'evoluzione - come 
qualcosa che virtualmente implica che ogni modificazione 
sia assai piccola. Il tempo intercorso tra gli ultimi antenati 
comuni di uomini e scimpanzé e la comparsa dei moderni 
esseri umani non è dunque sufficiente per avere un 
incremento consistente della cognizione. Di conseguenza, 
all’alba del linguaggio, ci poteva essere solo una differenza 
relativamente piccola tra le facoltà cognitive degli antenati 
degli esseri umani e dei loro parenti più stretti. 

Darwin stesso (1871, p. 57 [trad. it. p. 79]) suppose che «i 
poteri mentali in alcuni primi progenitori dell’uomo devono 
essere stati più altamente sviluppati che in ogni scimmia 
esistente, anche prima che la più imperfetta forma di 
discorso fosse entrata nell'uso». La visione secondo cui 
l'intelligenza è un prerequisito per il linguaggio, e non una 
sua conseguenza, è ampiamente condivisa da autori 
moderni. Burling (2005, p. 72) lo afferma in maniera 
decisa: «Anche prima di cominciare a parlare, [gli antenati 
degli esseri umani] devono aver interagito con il mondo 
grazie a una ricca dotazione concettuale. Non è possibile 
dare nomi a cose ed eventi se chi li apprende non ha già la 
capacità di formarsi i concetti di quelle cose e di quegli 
eventi». Questo tipo di considerazioni sembra non tener 
conto della possibilità che linguaggio e cognizione si siano 
sviluppati insieme in una spirale evolutiva. 

Se guardiamo alle evidenze empiriche, fin dagli anni 
sessanta è noto che persino i piccioni sono in grado di 
formarsi dei concetti sia di una gran varietà di oggetti 


naturali e artificiali sia di altri organismi - non solo di quelli 
che gli sono gia in qualche modo familiari (per esempio, gli 
esseri umani), ma anche di quelli di cui quasi certamente 
non hanno alcuna esperienza pregressa (per esempio, i 
pesci; Herrnstein 1985; Pearce 1989; Watanabe 1993). 
Naturalmente, questi sono dei risultati sperimentali. Ma la 
formazione di concetti avviene anche in natura. Le 
ghiandaie americane (Clayton e Dickinson 1998; Emery e 
Clayton 2001; Raby et al. 2007) mostrano che i concetti di 
altre specie possono persistere nella loro mente anche in 
assenza di uno stimolo proveniente dall'oggetto a cui il 
concetto si riferisce. Quando fanno provviste per l'inverno, 
le ghiandaie americane accumulano migliaia di riserve di 
cibo in posti differenti, per poi andare a riprenderlo molti 
mesi dopo, consumando per primi gli alimenti più 
deperibili. Sono addirittura in grado di accorgersi se altri 
uccelli le osservano mentre stanno accumulando le riserve; 
e, se ciò accade, riseppelliscono il cibo (Dally et al. 2006). 
Questo suggerisce che si aspettino che gli altri uccelli 
possano rubare le loro provviste, se questo non gli viene 
impedito - un mindreading piuttosto sofisticato per degli 
uccelli. 

Se le ghiandaie e i piccioni sono in grado di formarsi e 
mantenere concetti, è lecito aspettarsi che lo siano anche le 
scimmie. Gli esperimenti di Kohler (1927) mostrarono che 
quando dovevano risolvere un problema le scimmie non si 
limitavano a utilizzare gli oggetti disponibili al momento, 
ma andavano anche a recuperare scatole o altri oggetti 
situati in posti diversi per arrivare al frutto che non 
riuscivano a raggiungere. Naturalmente, questo potrebbe 
essere derubricato a mera capacità di richiamare alla 
mente degli oggetti specifici e la loro locazione spaziale, 
piuttosto che essere considerato come un vero e proprio 
possesso di categorie astratte di oggetti o locazioni 
spaziali; il possesso di veri concetti simili a quelli umani è 
qualcosa di molto più difficile da dimostrare. Non è però 


altrettanto semplice sminuire le performance delle scimmie 
addestrate a «parlare». Uno dei casi più impressionanti è 
stato l'addestramento dei due scimpanzé Sherman e Austin 
a usare dei lessigrammi non semplicemente per delle classi 
concrete di oggetti (per esempio, generi diversi di utensili o 
cibi), ma anche per le classi astratte e di ordine superiore 
«Cibo» e «utensile». Questo suggerisce la capacità di 
acquisire almeno un aspetto del simbolismo: le relazioni tra 
i concetti e il loro ordine gerarchico. 

Alcuni autori (per esempio, Chater e Hayes 1994) hanno 
proposto la conclusione piuttosto pessimistica che sia 
prematuro affermare che i non-umani possiedano dei 
concetti simili a quelli umani, dal momento che le 
definizioni umane di concetto sono inestricabilmente 
connesse al linguaggio, e noi non sappiamo quali siano le 
realizzazioni neurali dei concetti negli animali. Questo 
modo di vedere le cose, per quanto comprensibile, appare 
ingiustificatamente restrittivo. Posto che un animale abbia 
una qualche rappresentazione di una classe di entità X, che 
possa essere innescata da un qualsiasi genere di 
presentazione di X o da un evento o da un ricordo qualsiasi 
in cui X sia in qualche modo coinvolta, pare ragionevole 
sostenere che quell’animale abbia un concetto di X che, in 
sé e per sé, non è significativamente diverso dal concetto di 
X che hanno gli esseri umani. 


Prove contro la cognizione avanzata 


Tuttavia, come mostrato in precedenza, l’argomentazione 
a sostegno della cognizione avanzata in organismi 
prelinguistici si basa su evidenze indirette: la capacità che 
tali organismi hanno di comportarsi in modi che 
suggeriscono fortemente, ma non necessariamente 
provano, il possesso da parte loro di concetti simili a quelli 
umani. Quando traiamo delle conclusioni su questi 
comportamenti, dobbiamo sempre prestare ascolto al 


monito di Shettleworth (2010, p. 4): «La ricerca spesso 
rivela che dei processi semplici, a quanto pare diversi dal 
ragionamento esplicito, svolgono compiti 
sorprendentemente complessi». 

Altrettanto significative delle cose che i non-umani sanno 
fare sono le cose che non sanno fare. Se essi hanno davvero 
una cognizione avanzata, come si spiega il lungo elenco di 
comportamenti cognitivi propri dei soli esseri umani 
proposto da Penn et al. (2008, p. 109) e gia citato nel 
capitolo 1? «Gli esseri umani - e nessun altro animale - 
accendono fuochi e costruiscono ruote, fanno diagnosi delle 
malattie altrui, comunicano per mezzo di simboli, navigano 
con l’ausilio di mappe, rischiano la propria vita per degli 
ideali, collaborano gli uni con gli altri, spiegano il mondo in 
termini di cause ipotetiche, puniscono i forestieri perché 
infrangono le leggi, immaginano scenari possibili e si 
insegnano a vicenda come fare tutte le cose appena 
menzionate». Di sicuro, l’unica cosa che rende possibili tali 
comportamenti è una forma di cognizione molto più 
avanzata di quella delle altre specie. La semplice mancanza 
di etichette per i concetti o di canali per produrre 
proferimenti non sembra sufficiente a spiegare il fatto che i 
non-umani non siano in grado di fare tali cose. Concetti 
astratti, come quello di «causa», potrebbero essere difficili 
da trattare senza parole; ma che dire di concetti di cose, 
come «fuoco»? Se è vero, come è stato suggerito talvolta, 
che l’uso del fuoco è cominciato con la raccolta di materiale 
ancora incandescente dopo la scarica di un fulmine, questo 
non richiedeva un linguaggio. Né lo richiedevano le 
trappole fatte di liane, o quelle fatte con i pesi o le fosse 
ricoperte con i pali sul fondo - tutte queste cose, o anche 
soltanto una di esse, avrebbero aumentato di gran lunga la 
capacità dei primati di catturare prede. Se le scimmie sono 
tanto intelligenti, perché nessuna di loro ha mai prodotto 
un'innovazione di questo tipo? 


Penn e i suoi collaboratori (2008) attribuiscono queste 
limitazioni dei non-umani al loro non essere in grado di fare 
ragionamenti astratti in aree come quelle delle inferenze 
transitive e delle relazioni causali. Sostengono che anche le 
operazioni più semplici come il test stesso/diverso e il test 
di confronto con un campione, che molte specie superano 
facilmente, hanno successo se gli oggetti usati nella prova 
hanno delle proprietà percettive, mentre falliscono se sono 
coinvolte proprietà che riguardano il ruolo di un oggetto 
(cioè proprietà funzionali). Al contrario, «un soggetto 
umano è perfettamente in grado di ragionare su categorie 
concernenti il ruolo, come “amanti” o “madri” o “utensili”, 
senza che ci sia un insieme di tratti percettivi comuni a 
tutti gli amanti, a tutte le madri o a tutti gli utensili» (p. 
125); 

Questo sembra alzare troppo l’asticella. «Amanti», 
«madri» e «utensili» sono categorie che possono non 
esistere prima del linguaggio. Né una madre né un amante 
né un utensile possiedono delle proprietà percettive che 
rendano possibile il loro riconoscimento in quanto madre, 
amante o utensile da parte di una certa entità. Per fare dei 
ragionamenti intorno a queste categorie, si deve essere in 
possesso di un insieme di predicati che definiscano le 
funzioni o le relazioni (per esempio, «madre» è una persona 
di sesso femminile che ha partorito qualcuno) e un altro 
insieme di predicati che assegnino l'appartenenza a una 
classe (per esempio, «un martello è un utensile», «una sega 
è un utensile», e così via). Non sorprende che i non-umani 
non abbiano tali capacità: questo segue direttamente dal 
fatto che non possiedono un linguaggio. 

Ciò che è davvero in gioco qui sono dei concetti molto più 
semplici: quei concetti che potrebbero avere una base 
puramente percettiva. Considerate, ad esempio, i concetti 
necessari per l'invenzione della trappola con i pesi. Tutto 
ciò che serve è immaginare un sentiero nel bosco e, sopra 
di esso, un tronco sorretto da dei bastoni sottili disposti in 


modo tale che, se uno di essi viene rimosso, il tronco cade; 
serve poi immaginare un animale che, camminando sul 
sentiero, rimuova il bastone. Questo scenario coinvolge 
solo delle entita concrete dotate di proprieta percettive. Gli 
scimpanzé amano la carne, quando riescono a 
procurarsela. Se dispongono dei concetti più elementari, 
perché non hanno mai pensato a nulla di tutto ciò? 


La soluzione del paradosso della cognizione 


I non-umani devono avere facoltà cognitive avanzate e 
concetti simili a quelli umani, dal momento che sono in 
grado di fare molte cose. I non-umani non possono avere 
facoltà cognitive avanzate e concetti simili a quelli umani, 
dal momento che non sono in grado di fare molte cose. 
Questo paradosso va risolto, se vogliamo comprendere il 
modo in cui gli esseri umani sono connessi alle altre specie. 

Un buon punto di partenza è la differenza tra pensiero 
online e pensiero offline (Bickerton 1990b). Il pensiero è 
online quando un individuo è impegnato in una qualche 
attività specifica e quell’attività occupa il fuoco del 
pensiero. Un pipistrello che si fa strada nelle profondità di 
una caverna, un'aquila che si dirige in picchiata su un 
coniglio che si muove rapidamente o un umano che si fa 
strada a fatica nel traffico sono tutti impegnati a pensare 
online. Il pensiero è offline quando concerne qualcosa che 
non ha nulla a che vedere con il comportamento messo in 
campo in quel momento da colui che pensa - per esempio, 
un umano che, mentre riposa, immagina mentalmente una 
trappola con un peso. I non-umani sono capaci di pensare 
offline? Poiché per ogni organismo che non abbia il 
linguaggio pensare offline sarebbe necessariamente 
un'operazione privata, non possiamo rispondere con 
certezza di no. Tuttavia non abbiamo buone ragioni per 
assumere che la risposta sia sì. Nel nostro caso, la capacità 
di pensare offline è ciò che sta alla base dell’immensa 


creatività e variabilità nel comportamento umano. La 
mancanza di quella capacità in tutti gli altri animali 
basterebbe per spiegare la loro scarsa creatività e la 
variabilità minima nel loro comportamento. Allo stesso 
modo, tanto la capacità degli umani di risolvere problemi 
eseguendo operazioni logiche astratte quanto l’incapacità 
dei non-umani di risolvere quegli stessi problemi, salvo si 
tratti di oggetti noti dotati di proprietà fisiche, 
suggeriscono che il pensiero offline sia appannaggio degli 
esseri umani. 

Ma imputare le limitazioni cognitive all’incapacita di 
pensare offline non è altro che un modo di riformulare il 
problema con parole diverse. Perché i non-umani non sono 
in grado di pensare offline? Finché non riusciremo a capire 
come concetti e categorie vengano effettivamente 
rappresentati nei cervelli di umani e non-umani, 
rispettivamente, non potremo fare altro che speculare. In 
queste condizioni, la strategia migliore è assumere la minor 
differenza possibile tra concetti umani e non umani che sia 
compatibile con le enormi differenze osservabili nel 
comportamento di entrambi. 

Assumiamo, come hanno già fatto molti, che non ci sia 
una differenza sostanziale tra concetti umani e concetti non 
umani. Che cosa, allora, può render conto delle differenze 
nel comportamento? Supponiamo che, nonostante la 
somiglianza, i concetti dei non-umani non possano 
connettersi liberamente e in maniera affidabile l'uno con 
l’altro e che non sia possibile avere un accesso volontario a 
essi. Questo, effettivamente, costituirebbe un impedimento 
al pensiero offline: nulla di ciò che l'organismo stia facendo 
in un certo momento innescherebbe i concetti necessari. Se 
le nostre assunzioni sono corrette, allora non c’è altro da 
dire. Se non lo sono, questo può essere soltanto per via del 
fatto che i concetti dei non-umani sono stati sovrastimati. 
Dovremmo allora ragionare su che cosa renda quei concetti 
impossibili da connettere e inaccessibili. Ma non saremmo 


costretti a riconsiderare la nostra assunzione originaria, 
poiché i problemi della connessione e dell’accessibilità 
rimarrebbero. 

l'assunzione secondo cui gli animali capaci di 
comportamenti complessi abbiano dei concetti la cui natura 
è di poco (se non per niente) diversa da quella dei concetti 
umani è supportata da alcuni studi recenti (per esempio, 
Newen e Bartels 2007; Aguilera 2011; Chittka e Jensen 
2011). La differenza di estensione della cognizione umana 
potrebbe essere spiegata non in termini di costituzione dei 
concetti stessi, ma in termini di fattori quali la possibilità di 
riattivarli in maniera volontaria e/o l’esistenza di 
connessioni neurali robuste tra le aree in cui essi vengono 
archiviati. 

Sia la riattivazione volontaria dei concetti sia la 
connessione neurale sono essenziali per pensare offline. 
Qualsiasi concetto deve essere continuamente accessibile e 
immediatamente recuperabile perché si possa produrre 
qualsiasi pensiero offline. Ma non si guadagna nulla 
semplicemente riattivando dei singoli concetti isolati gli uni 
dagli altri. È quindi essenziale essere in grado di 
connettere potenzialmente qualsiasi concetto con ogni altro 
- o almeno disporre di una rapida connessione tra un’ampia 
gamma di concetti, in modo che, evocandone uno, si abbia 
accesso immediato a tutti gli altri a esso connessi. È 
difficile che sia solo un caso se questi prerequisiti, oltre a 
essere essenziali per ogni tipo di pensiero complesso, sono 
gli stessi necessari per comunicare fluentemente tramite il 
linguaggio. 

Ma come si sono venuti a creare questi stessi 
prerequisiti? Ritorneremo su questo punto qui di seguito. 


IL PRIMO PASSO VERSO IL LINGUAGGIO 


Se vogliamo iniziare dal primissimo stadio del linguaggio, 
e se allo stesso tempo vogliamo cominciare esplorando la 
possibilità più probabile - cioè che sia stato il 
comportamento a causare i cambiamenti nella mente 
/cervello e non viceversa -, allora dobbiamo prendere in 
considerazione la comunicazione prelinguistica, per quanto 
in prima battuta questo possa sembrare poco promettente. 
(Si confronti il modo in cui trattavo questo problema in 
Bickerton 1990b con il modo in cui l’ho trattato in 
Bickerton 2009, modo quest’ultimo che Balari e Lorenzo 
2010 hanno considerato quasi come un atto di apostasia 
verso la posizione anti-comunicativa difesa nel lavoro 
precedente). Solo se questo percorso si rivela infruttuoso 
dovremmo prendere in considerazione lo sviluppo o altri 
fenomeni interni all'organismo. È fin troppo facile 
raccontare storie costruite ad hoc su degli ipotetici sviluppi 
interni - mutazioni fortuite o «leggi della forma», a 
tutt'oggi misteriose, che potrebbero aver portato al 
linguaggio. Ma sembra relativamente improbabile che 
appoggiare a parole la biologia, per poi selezionare 
accuratamente i biologi e i fenomeni biologici a cui 
prestare ascolto e attenzione (l'approccio adottato, 
purtroppo, da molti sedicenti «biolinguisti»), possa portare 
grandi risultati. È importante notare che nulla di quanto 
detto qui ha come conseguenza necessaria o implica che «il 
linguaggio si sia sviluppato a partire da una precedente 
forma di comunicazione», lo spauracchio di Balari e 
Lorenzo (2010) e di molti altri che aderiscono alla 
«biolinguistica» (si vedano Jenkins 2000; Boeckx e 
Grohmann 2007). Ciò che si è evoluto dalla precedente 
forma di comunicazione non è il linguaggio, o qualcosa di 
simile a esso, ma piuttosto un repertorio comunicativo 
incrementato che ha aperto le porte al successivo sviluppo 
del linguaggio. 

Come fa notare Conway Morris (2003), la convergenza 
(l'adozione di soluzioni simili a problemi simili) è ubiqua 


nell’evoluzione. Questo fatto suggerisce un modus operandi 
per la ricerca dell’origine del linguaggio. Se una qualche 
altra specie, per quanto lontana, ha mai oltrepassato anche 
uno solo dei limiti caratteristici del resto della 
comunicazione non umana, allora il problema (o i problemi) 
che un tale sviluppo ha innescato può essere stato 
fronteggiato anche dagli antenati degli esseri umani. Se 
questo fosse vero, avremmo a portata di mano il primo 
scenario plausibile per descrivere il primo passo verso il 
linguaggio. 


GLI IMENOTTERI DIMENTICATI 


Forse, l’unica breccia evidente aperta nei limiti della 
comunicazione precedente ha a che fare con il 
dislocamento. Il dislocamento è considerato una delle 
proprietà caratterizzanti del linguaggio (Hockett e Altmann 
1968) e viene definito come «la capacità di parlare di cose 
che non sono fisicamente presenti». Le uniche specie di cui 
conosciamo i meccanismi di dislocamento sono molto 
distanti dagli esseri umani da un punto di vista filogenetico 
- si tratta delle api e delle formiche. Il processo generale 
può essere inferito nel caso dei corvi (Heinrich 1991), ma 
in questo caso il metodo di esecuzione è ancora ignoto. Api 
e formiche utilizzano due meccanismi molto diversi tra loro. 
(Per quanto riguarda le danze complesse delle api, si 
vedano Frisch 1967; Dyer e Gould 1983; per quanto 
riguarda i metodi chimici o comportamentali delle 
formiche, si vedano Wilson 1962; Holldobler 1971, 1978; 
Moglich e Holldobler 1975). Il comportamento in quanto 
tale e la sua funzione sono però identici. 

La distanza filetica tra umani e imenotteri, il fatto che 
questi ultimi operino sulla base dell’istinto (ricordate che 
invece si suppone che gli umani operino sulla base di una 
«cognizione avanzata»), le profonde differenze 


nell’organizzazione (sociale in un caso, eusociale nell’altro) 
e le enormi differenze nella dimensione del cervello hanno 
finora scoraggiato i ricercatori che si occupano di 
evoluzione del linguaggio dal prendere sul serio l’ipotesi 
che la comunicazione degli imenotteri sia rilevante. Ma 
prima di sbarazzarsi delle api e delle formiche bisogna 
considerare che ci sono alcuni fatti che rendono quelle 
differenze molto meno rilevanti. In primo luogo, il 
linguaggio, inteso come un meccanismo fisico interno al 
cervello, sta ben al di sotto della soglia della cognizione 
cosciente, e di conseguenza in esso c’è tanto istinto quanto 
se ne trova in ciò che fanno le api e le formiche. In secondo 
luogo, alcuni studiosi hanno avanzato in maniera molto 
seria la proposta che, se escludiamo il comportamento 
riproduttivo, gli umani sarebbero da includere tra le specie 
eusociali (Foster e Ratnieks 2005), per quanto «non in 
senso stretto» (Nowak et al. 2010). In terzo luogo, e cosa 
più importante, i lavori sulla convergenza evolutiva 
(Conway Morris 2003, 2008; Liu et al. 2010; McGhee 2011) 
hanno mostrato che fattori quali la relativa dimensione del 
cervello e la distanza filetica sono abbastanza irrilevanti 
per i processi di convergenza. Sarebbe perfettamente 
possibile (e altamente auspicabile) creare una mappa della 
convergenza tra organismi (qualcosa di simile in linea di 
principio ai digrammi della cladistica) che, invece di 
raggruppare le specie sulla base delle loro caratteristiche 
fisiche, le raggruppi in funzione dei loro habitat e dei loro 
mezzi di sostentamento. 

Se pensiamo che la cooperazione su larga scala si trova 
solo negli imenotteri e negli esseri umani, diventa ancora 
più evidente la legittimità della comparazione tra questi 
due tipi di organismi, apparentemente tanto diversi. 
Dobbiamo considerare i problemi che formiche e api hanno 
affrontato e che hanno condotto a quei comportamenti 
comunicativi e cooperativi che sono rilevanti per i nostri 
scopi, per vedere se gli antenati degli esseri umani (ma non 


altre specie di primati) abbiano dovuto davvero affrontare 
dei problemi simili. 

Sia le api sia le formiche sono dei foraggiatori estrattivi 
(onnivori, nel caso delle formiche). Entrambe consumano 
cibi spesso di grandi dimensioni, dalla vita relativamente 
breve (pezzi di piante da fiore nel caso delle api, organismi 
morti nel caso delle formiche) e che non potrebbero essere 
consumati per intero da individui isolati. Questi fattori 
rendono necessario il reclutamento di altri individui dello 
stesso nido dando loro informazioni circa la locazione, e in 
alcuni casi la natura o la qualita, del cibo. Il fatto che 
quest’ultimo si trovi di norma lontano dal luogo in cui 
l'informazione viene trasmessa impone un tipo di 
comunicazione dislocata. 

Un problema ecologico molto simile venne affrontato 
dagli antenati degli esseri umani, ma non da altre specie di 
primati, circa due milioni di anni fa: aveva a che fare con la 
saprofagia conflittuale, e in particolare con la saprofagia 
condotta sulle carcasse della megafauna. Per mostrare 
come questo sia accaduto, servono alcuni cenni storici. 


UNA NICCHIA PER «HOMO» 
BASATA SULLA SAPROFAGIA? 


Tra i quattro e i due milioni di anni fa, il clima dell’Africa 
orientale divenne sempre più secco. Di conseguenza, 
«Homo fu il primo ominide a vivere in zone di pascolo 
abbastanza accessibili e piuttosto aride» (Reed 1997, p. 
289). In questo periodo si verificarono dei grandi 
cambiamenti nella distribuzione delle specie, come 
mostrano le statistiche della valle dell’Omo - un habitat 
posto al centro dell’area in cui era localizzata la maggior 
parte dei siti ominidi (Bobe et al. 2002). A cavallo fra i tre e 
i due milioni di anni fa, essendosi ridotte drasticamente le 
loro risorse di cibo, i primati diminuirono di circa il 50 per 
cento, mentre i bovidi, traendo vantaggio dai grandi pascoli 


aperti, aumentarono di oltre tre volte il proprio numero, 
passando dal 17 per cento al 54 per cento della fauna 
totale. Questo aumento rese la carne la fonte di cibo con il 
maggior apporto calorico a fronte del minor dispendio di 
energia e pertanto, secondo la teoria del foraggiamento 
ottimale (Stephens e Krebs 1986), ogni specie in grado di 
cibarsene avrebbe dovuto preferirla agli altri alimenti. 

Si può presumere che la carne sia sempre stata 
un'aggiunta ben accetta nella dieta dei primati. (Per una 
discussione della caccia negli scimpanzé, si veda Boesch 
1994; Boesch e Boesch 1989; Mitani e Watts 1999). Si noti, 
tuttavia, che la strategia di caccia preferita dagli scimpanzé 
- lasciare singole scimmie su alberi alti - sarebbe stata 
difficilmente applicabile nella savana, mentre la tecnologia 
di cui disponevano Homo habilis e Homo erectus sarebbe 
stata inadeguata per catturare prede di grossa o media 
taglia (Binford 1985). Senza dubbio, la caccia veniva 
praticata, ma aveva un carattere opportunistico, era 
limitata ad animali piccoli, deboli o vecchi ed era 
inadeguata per far fronte alla perdita delle risorse 
alimentari patita dai frugivori. La tecnologia umana era 
però estremamente ben adattata per la saprofagia: tra gli 
utensili vi erano scaglie di pietra molto affilate in grado di 
tagliare anche le pelli più spesse (Schick e Toth 1993) e 
cunei di pietra che, oltre a poter essere usati per macellare, 
avevano proprietà aerodinamiche tali per cui potevano 
essere utilizzati come dei veri e propri proiettili (O’Brien 
1981) per scacciare eventuali rivali nella saprofagia. 

La saprofagia era un comportamento raro o assente negli 
altri primati (Teleki 1975, 1981) - e questa è stata ritenuta 
una prova contro il fatto che gli antenati degli esseri umani 
la praticassero (per esempio, Geist 1987). Tuttavia, quale 
cibo una specie si procacci e come se lo procuri non è 
determinato tanto da fattori genetici (a meno che questi 
ultimi non rendano certi cibi indigeribili), quanto da ciò che 
l’ambiente ha da offrire. Gli habitat degli altri primati 


avevano reso la saprofagia non necessaria, mentre alcuni 
degli habitat degli antenati degli umani l'avevano resa 
inevitabile per ragioni di sopravvivenza. 

Ci sono prove in abbondanza per sostenere che alcune 
varietà di Homo praticassero la saprofagia. Se si analizzano 
i reperti anteriori a due milioni di anni fa, è normale 
trovare sugli ossi delle tracce di tagli (segno di 
macellazione) che si sovrappongono alle tracce lasciate dai 
denti di altre specie - il che indica che i preumani potevano 
impadronirsi degli ossi soltanto dopo che gli altri animali li 
avevano parzialmente, o interamente, privati della carne. 
Nei reperti più recenti di due milioni di anni, si riscontra 
invece con frequenza sempre maggiore che le tracce 
lasciate dai denti sono sovrapposte a quelle dei tagli - il che 
indica che erano i preumani a essersi impadroniti per primi 
degli ossi (Bunn e Kroll 1986; Blumenschine 1987; 
Blumenschine et al. 1994; Monahan 1996; Dominguez- 
Rodrigo et al. 2005). Dal momento che alcuni degli animali 
in questione sono troppo grandi per poter essere cacciati 
con successo usando gli strumenti che gli ominidi 
dell’epoca avevano a disposizione, la saprofagia diventa 
un'opzione inevitabile. 

È significativo che anche altri fattori presenti in zone 
abbastanza diverse facciano supporre che ci furono dei 
cambiamenti nel comportamento e nella fisiologia umana 
del pari risalenti a circa due milioni di anni fa. Due di 
questi, che sembra ovvio connettere fra loro, sono i 
cambiamenti negli schemi del foraggiamento (Larick e 
Ciochou 1996) e nella fisiologia che suggeriscono un 
adattamento per la resistenza nella corsa (Bramble e 
Lieberman 2004). Il primo coinvolge un cambiamento dalla 
saprofagia condotta in un’area ristretta a partire da un 
punto centrale (catchment scavenging) alla saprofagia 
condotta su un territorio più esteso senza un punto focale 
(territory scavenging). Il secondo coinvolge le differenze 
tra Homo habilis e Homo erectus, essendo il primo più 


grande e più alto e dotato di gambe più lunghe e di uno 
scheletro essenzialmente moderno. Entrambi questi 
cambiamenti sono compatibili con una nicchia che, pur non 
offrendo soltanto la saprofagia, prevedeva in misura 
significativa la localizzazione e il procacciamento di grandi 
carcasse muovendosi all’interno di quelle che, con ogni 
probabilità, erano aree molto estese. 

In ogni caso si trattava, inevitabilmente, di una 
saprofagia di tipo conflittuale. Non disponendo della 
tecnologia per uccidere animali piuttosto grandi, i 
preumani dovevano impadronirsi delle carcasse degli 
animali morti per cause naturali (caso non frequente 
eccezion fatta per le specie più grandi) oppure di quelli 
uccisi dagli altri carnivori. In entrambi i casi era probabile 
venirsi a scontrare con la feroce resistenza sia dei 
predatori (i quali pure, quando possibile, praticavano la 
saprofagia perché a differenza della caccia permetteva di 
risparmiare energie) sia degli altri saprofagi. Ancora ai 
tempi di Homo erectus, infatti, gli umani avevano le stesse 
probabilità di predare e di essere loro stessi delle prede 
(Hart e Sussman 2005). Solo ben più tardi di due milioni di 
anni fa ci fu una diminuzione significativa del numero di 
ossa umane ritrovate nelle caverne usate dai predatori nei 
dintorni di Swartkrans, in Sudafrica (Pickering et al. 2007). 
Sprovvisti sia di armi artificiali sia di armi naturali (denti, 
artigli, ecc.), ai preumani era rimasta una sola risorsa: il 
loro numero. Solo se fossero stati in grado di reclutare una 
quantità di propri simili sufficientemente grande da 
consentirgli di scacciare i competitori avrebbero potuto 
sperare di impadronirsi per primi di un maggior numero di 
carcasse. 

In altre parole, il problema ecologico che si trovarono ad 
affrontare era sorprendentemente simile a quello che aveva 
condotto all'emergere del dislocamento tra le formiche e le 
api - l’unica differenza era che in questo caso la 
deperibilità della fonte di cibo si accompagnava al bisogno 


di escludere i competitori (assenti nel caso delle api e 
relativamente innocui nel caso delle formiche, mentre 
rappresentavano un problema molto più serio nel caso dei 
corvi). Entrambi questi fattori rendevano essenziale la 
velocità d’esecuzione. Ma il reclutamento presenta 
inevitabilmente dei problemi per una specie non eusociale. 

Il reclutamento richiede la cooperazione, e raramente i 
primati cooperano. Nelle rare occasioni in cui lo fanno (in 
genere la condivisione della carne come simbolo di valore), 
la cooperazione può essere spiegata in termini di selezione 
parentale (Hamilton 1964), altruismo reciproco (Trivers 
1971), «furterelli tollerati» (Isaac 1978 [trad. it. p. 98]), 
conseguenza delle sanzioni contro chi cerca di barare 
(Clutton-Brock e Parker 1995) o «segnalazione costosa» in 
vista di un qualche beneficio futuro (Hawkes 1991). Ma 
anche quando c’è cooperazione, di rado va oltre la coppia. 
Il genere di cooperazione richiesto nel reclutamento per 
impadronirsi delle carcasse coinvolge di necessità un 
grande gruppo di individui ed è qualcosa di assolutamente 
sconosciuto a tutte le specie di primati esistenti, tranne 
una. 

De la Torre Sainz e Dominguez-Rodrigo (1998) 
individuano correttamente le origini della cooperazione 
umana facendola risalire al contesto del consumo della 
carne, anche se la loro proposta è meno specifica di quella 
che sto sviluppando io qui, poiché essi non sono in grado di 
determinare quale ruolo relativo abbiano giocato la caccia 
e la saprofagia. Senza uno scenario di questo tipo, che 
prevede il reclutamento, non c’è nessuna spiegazione 
convincente di come abbia avuto inizio la cooperazione 
umana (la cui forza non ha eguali al di fuori degli 
imenotteri). Recentemente, usando la teoria dei giochi, si 
sono proposti molti modelli per i conflitti cooperazione- 
competizione (Maynard Smith 1982; Axelrod 1984). 
Nessuno dei modelli disponibili al momento rappresenta 
esattamente tutte le dimensioni coinvolte negli scenari 


della saprofagia conflittuale, ma una buona 
approssimazione è offerta dai giochi non lineari a N- 
persone che riguardano il bene pubblico (Archetti e 
Scheuring 2011): «In questi modelli, i cooperanti pagano 
un prezzo e contribuiscono a un bene pubblico che, nei casi 
più semplici, può essere consumato da tutti i membri» 
(Bickerton e Szathmary 2011). In queste situazioni il costo 
(in questo caso il tempo e l’energia spesi, oltre a un 
qualche rischio di rimanere feriti o di morire nel confronto 
con i rivali) non dovrebbe superare lo stesso bene pubblico 
(una grande fornitura di carne, che potrebbe garantire il 
sostentamento dei cooperanti per diversi giorni). Se tutti 
cooperassero, ciascuno riceverebbe questo beneficio. Se 
invece i cooperanti fossero in numero insufficiente, nessuno 
riceverebbe alcun beneficio. Quest’ultimo fattore 
renderebbe molto più probabile la punizione per coloro che 
si chiamano fuori - un fattore molto potente per 
incoraggiare la cooperazione, secondo Boyd et al. (2003). 

Tuttavia la scelta tra cooperare e chiamarsi fuori dipende 
in maniera cruciale dalle informazioni - un genere di 
informazioni che nessun altro primate, e difficilmente 
qualche altra specie, era in grado di fornire, dal momento 
che la fonte di quelle informazioni si sarebbe trovata, il più 
delle volte, ben al di fuori della portata degli organi di 
senso dei potenziali destinatari. 


SAPROFAGIA CONFLITTUALE E DISLOCAMENTO 


Consideriamo innanzitutto i vincoli che determinano la 
dimensione dell'unità di foraggiamento. Anche se dei 
numeri più grandi aiutano a proteggersi meglio dai 
predatori, gli animali devono andare alla ricerca di cibo 
all’interno di un’area che copra il loro fabbisogno 
energetico e nutrizionale (Chapman et al. 1995), rendendo 
così antieconomiche delle squadre per il foraggiamento 


troppo grandi. Di conseguenza, nel caso di molte specie di 
primati, si sono osservati degli schemi caratterizzati da 
scissioni e fusioni nei gruppi di foraggiamento (Kummer 
1971; Lehmann et al. 2007), e negli ambienti della savana 
«le esigenze dettate dalla ricerca diurna richiedevano che 
gli individui andassero alla ricerca del cibo suddivisi in 
piccoli gruppi» (Aureli et al. 2008, p. 31). Per quanto una 
squadra di grandi dimensioni possa essere efficace come 
protezione contro i predatori, come unità di foraggiamento 
non avrebbe coperto una porzione di suolo abbastanza 
grande da garantire cibo per tutti i membri, e la 
conseguenza sarebbe stata la fame. Supponiamo ora, però, 
che uno dei gruppi più piccoli s’imbattesse in una carcassa 
di grandi dimensioni di un animale morto da poco. Che cosa 
avrebbe dovuto fare? Se nei paraggi si trovavano già altri 
saprofagi, dei piccoli numeri non avrebbero consentito di 
macellare l’animale in maniera sicura e, al contempo, di 
tenere lontani gli altri saprofagi; alcuni dei membri del 
gruppo sarebbero diventati essi stessi delle prede. Sarebbe 
quindi servito l’aiuto di altri gruppi che componevano la 
squadra. Ma è molto probabile che questi altri gruppi 
fossero troppo lontani, magari a diversi chilometri di 
distanza, per vedere e sentire. In che modo si sarebbero 
potute trasmettere delle informazioni abbastanza 
dettagliate e precise da assicurare una cooperazione 
efficace? Soltanto estendendo il proprio modo di 
comunicare con l'introduzione del dislocamento. 

Si noti che solo gli antenati degli esseri umani si sono 
trovati in una situazione come questa, che connette un 
bisogno (nutrizionale) fondamentale a un comportamento 
che, per poter essere messo in campo con successo, 
richiede qualcosa di più della normale comunicazione 
animale - due fattori che mancano visibilmente nelle 
precedenti teorie dell'evoluzione del linguaggio. In che 
modo fu possibile mettere in campo quel comportamento? 
Potremmo non saperlo mai, ma se formiche e api ci 


riuscirono, a maggior ragione poteva riuscirci un primate 
evoluto. Forse fu coinvolto qualcosa come la corsa in 
tandem delle formiche (nella quale una formica ne afferra 
letteralmente un’altra perché la segua). E probabile che gli 
individui imitassero i suoni o i gesti tipici della specie cui 
apparteneva la carcassa per dare un’idea delle sue 
dimensioni - il che, a sua volta, incoraggiava la 
cooperazione. Anche l’indicazione della distanza e della 
direzione sarà stata d’aiuto, come nel caso delle api. 
Chiaramente, in una tale situazione, si adottava qualsiasi 
cosa funzionasse da un punto di vista comunicativo, 
rendendo così del tutto irrilevanti le frequenti discussioni 
intorno al problema se «le primissime forme di linguaggio» 
fossero vocali o gestuali. 

Va notato un ulteriore fattore che, per quanto all’epoca di 
importanza limitata, si sarebbe poi rivelato indispensabile 
per l'evoluzione sia del linguaggio sia della cognizione 
avanzata. Finora - a meno che non si accetti la dubbia 
premessa secondo cui i segnali con riferimento funzionale 
fossero delle proto-parole per indicare le specie predatrici - 
nessun segnale, se si esclude il repertorio degli imenotteri, 
si riferiva in maniera specifica ad aspetti oggettivi del 
mondo naturale e a entità al suo interno. In altre parole, 
l’idea che il mondo potesse consistere di oggetti nominabili 
era letteralmente inconcepibile per le menti degli animali. 
Questo è un altro problema che i ricercatori in questo 
campo hanno sottostimato in maniera sistematica. 

Il reclutamento per la saprofagia conflittuale costrinse la 
mente preumana ad accettare quell'idea. Quando un 
preumano che avesse appena scoperto una carcassa 
compariva davanti ad altri membri della sua specie 
gesticolando, producendo suoni e movimenti strani, la 
ragione poteva essere solo quella di veicolare 
un'informazione: «C'è un mammut morto proprio sopra la 
collina, venite ad aiutare a prenderlo!». Come si ricorderà, 
alcune specie di formiche presentano dei campioni di cibo 


per incoraggiare la cooperazione. Il nostro ipotetico 
preumano difficilmente avrebbe potuto portare con sé un 
pezzo di carne di mammut, ma avrebbe potuto far capire di 
quale animale si trattava mimandone i movimenti e/o 
replicandone il verso. La capacità di dare un nome alle 
specie si sarebbe rivelata non solo centrale per il 
linguaggio quando questo emerse, ma avrebbe anche 
stabilito la connessione tra i segnali volontari e i relativi 
concetti, cruciale per lo sviluppo sia del linguaggio sia della 
cognizione avanzata. 

In Bickerton (2009) ho preso in considerazione solo la 
pratica della saprofagia condotta sulla megafauna - 
carcasse degli antenati di elefanti, rinoceronti e così via. In 
Bickerton e Szathmary (2011) si propone uno sviluppo più 
graduale della saprofagia conflittuale, a partire dalle 
carcasse di piccoli animali abbandonate oppure prese di 
mira solo da uno o due predatori o da qualche avvoltoio, 
per passare progressivamente a carcasse di dimensioni 
maggiori e meglio protette, man mano che miglioravano sia 
la capacità di allontanare i saprofagi competitori (grazie a 
un’accresciuta abilità nel lancio di oggetti contundenti a 
distanze maggiori) sia quella di macellare le carcasse 
(grazie alla tecnologia acheuleana invece di quella 
olduvaiana). Qualcuno ha suggerito (Robert  Blust, 
comunicazione personale, 2 dicembre 2013) che, per 
scoraggiare la competizione, gli ominidi dell’epoca 
potrebbero aver usato il fuoco, oltre a lanciare oggetti. 
Questo presuppone che fossero in grado di accendere un 
fuoco. (Difficilmente sarebbero riusciti a mantenere il fuoco 
acceso per lunghi periodi, in attesa di incappare in una 
carcassa di grandi dimensioni). Ad ogni modo, talvolta 
durante la scheggiatura delle pietre si saranno prodotte 
delle scintille, le quali avranno occasionalmente incendiato 
del materiale vegetale secco: questa rimane una possibilità 
che non può essere scartata per spiegare l’inizio della 
produzione controllata del fuoco e del suo primo uso. 


Quel che è certo è che abbiamo prove di un incremento 
nel consumo di carne a partire da due milioni di anni fa 
circa (Eaton e Cordain 2002; Ungar et al. 2006). Dopo che 
la carcassa era stata conquistata e macellata, si può 
presumere che ne venissero portate alcune porzioni scelte 
nel posto sicuro più vicino e che lì venissero consumate. È 
anche possibile che gli ominidi giocassero d’anticipo e 
seguissero le tracce di mandrie di erbivori prestando 
attenzione a eventuali animali malati che potessero 
costituire delle future prede - al momento, però, questa 
rimane un’ipotesi puramente speculativa. 

Qualsiasi teoria che voglia spiegare perché e come abbia 
avuto origine il linguaggio deve superare una serie di test. 
La pressione selettiva coinvolta nel processo deve esserci 
stata soltanto per gli antenati degli esseri umani - 
altrimenti bisogna spiegare perché quella stessa pressione 
non abbia avuto alcun effetto nel caso degli altri primati. Il 
risultato del processo deve essere fin dall’inizio pienamente 
efficiente - altrimenti nessuna forma di linguaggio sarebbe 
mai divenuta stabile. Dal momento che i segnali di 
dislocamento non comportavano un gran dispendio di 
energia, si trattava di «segnali a basso costo» (Zahavi 1975, 
1977) a cui probabilmente nessun membro di una specie 
capace dell’inganno tattico avrebbe davvero creduto o 
prestato attenzione. Poiché i primati sono egoisti, 
l'informazione scambiata deve avere per il mittente la 
stessa utilità che ha per il destinatario (proprio come la 
cooperazione deve essere vantaggiosa sia per chi invita sia 
per chi è invitato a cooperare). 

Solo la teoria che sto esponendo qui supera tutti e 
quattro i test. Lunicita è soddisfatta dal fatto che la 
saprofagia conflittuale non è mai stata intrapresa da 
nessun altro primate. L'efficienza iniziale è soddisfatta dal 
fatto che la prima ridotta manciata di segnali avrebbe 
portato benefici tangibili e immediati. Il problema di 
credibilità sollevato dai «segnali a basso costo» è risolto dal 


fatto che la presenza effettiva delle carcasse avrebbe in 
poco tempo confermato le affermazioni circa la loro 
disponibilità (0, in caso di disconferma, avrebbe 
rapidamente condotto a delle sanzioni contro chi aveva 
mentito). Legoismo non sarebbe stato un ostacolo, dal 
momento che, senza uno scambio di informazioni, né il 
mittente né il destinatario avrebbero ricevuto alcun 
beneficio. 


LA SAPROFAGIA E IL PROBLEMA DI WALLACE 


È essenziale sottolineare che se l’evoluzione si fosse 
interrotta al punto in cui ci troviamo ora, Wallace non 
avrebbe avuto alcun problema da sollevare. Nel capitolo 1 
abbiamo visto come egli fosse turbato dal fatto che il 
linguaggio e la cognizione umana eccedessero di gran 
lunga i bisogni di qualunque specie preumana - turbato al 
punto da non riuscire a credere che fossero il prodotto 
delle normali forze dell'evoluzione. Solo per questo si sentì 
in dovere di fare un'eccezione e appellarsi al divino per 
spiegare le facoltà umane, anche a costo di assassinare il 
parto del proprio ingegno, come Darwin ebbe a far notare. 

A questo punto, ciò che gli antenati degli esseri umani 
avevano a disposizione era un sistema di comunicazione 
incrementata adeguato per sviluppare una nuova nicchia: 
la nicchia della saprofagia conflittuale. Tutto questo 
sarebbe andato bene a Wallace. Perché i nostri antenati 
avrebbero avuto bisogno di qualcosa di più? Che cosa 
avrebbe determinato la selezione di adattamenti ancora più 
complessi? 

Il linguaggio nella sua forma moderna è così chiaramente 
adattivo e fornisce un controllo sull'ambiente a tal punto 
inedito che viene automatico assumere che, una volta 
iniziato, qualsiasi suo miglioramento sarebbe stato 
premiato dalla selezione. Due considerazioni di ordine 


differente, ma complementari, suggeriscono che questa 
assunzione è, nel migliore dei casi, prematura. 
Innanzitutto, per quanto il linguaggio al suo stato attuale 
possa essere altamente adattivo, non è per nulla scontato 
che nei suoi stadi intermedi, specialmente i primi, lo sia 
stato altrettanto. Possiamo inventarci delle storie ad hoc sul 
perché avrebbe dovuto esserlo. Per esempio, potremmo 
dire che gli individui dotati di migliori abilità linguistiche 
avrebbero acquisito più compagni o raggiunto più 
facilmente posizioni di leadership, aumentando così il 
proprio contributo al patrimonio genetico. Ma queste non 
sono neppure delle storie ad hoc: sono dei tentativi 
disperati di aggirare il problema di Wallace, mostrando che 
il consueto processo di selezione naturale può rendere 
conto di ogni passaggio dell’evoluzione umana. 

La seconda considerazione riguarda le testimonianze 
paleoarcheologiche. Se il linguaggio ha prodotto dei 
risultati significativi nello sviluppo di comportamenti nuovi 
e più efficaci, sarebbe lecito attendersi, a partire da circa 
due milioni di anni fa, un graduale ma incessante 
miglioramento degli artefatti e delle altre tracce fisiche del 
comportamento umano. In realtà non assistiamo a nulla del 
genere. Per la maggior parte di quel periodo, durato quasi 
due milioni di anni, l'inventario degli utensili si è 
accresciuto di poco, e anche quelli già esistenti cambiarono 
molto lentamente: il cuneo acheuleano ha mantenuto la 
stessa forma e le stesse proporzioni per più di un milione di 
anni. «I complessi manifatturieri dell’Olduvaiano e 
dell’Acheuleano sono degni di nota per la lentezza dei loro 
progressi tra 2,5 e 0,3 [milioni di anni fa] e per la limitata 
mobilità e interazione regionale» (Ambrose 2001, p. 1752). 
Un ritmo tanto fiacco suggerisce che, con buona pace di 
Pinker e Bloom (1990), la selezione non fosse fortemente 
orientata nella direzione del linguaggio. 

Naturalmente, la stessa argomentazione si potrebbe 
usare per sostenere che il linguaggio non è davvero esistito 


fino a 50-100.000 anni fa, in nessuna delle sue forme. 
Purtroppo questo comporta di dover accettare una delle 
due cose: che il linguaggio sia sbocciato in tutta la sua 
odierna complessita da uno stato non linguistico, senza 
l'intervento di nessuna circostanza scatenante e come 
risultato di certe leggi ancora sconosciute o di una qualche 
mutazione fortuita; ovvero che tutto quanto è necessario 
per il linguaggio fosse già dato, ad eccezione forse di una 
cosa, la ricorsività, la quale, per qualche misterioso motivo 
e in modi altrettanto misteriosi, sarebbe riuscita a rendere 
tutti quei prerequisiti un unico pacchetto perfettamente 
funzionante. 

Si noti che accettare tutto ciò non offre alcuna soluzione 
al problema di Wallace. Dal momento che lo stato di cose 
immediatamente precedente alla comparsa degli esseri 
umani anatomicamente moderni (come detto in 
precedenza) era cambiato di poco nei precedenti due 
milioni di anni, lo scarto tra i bisogni umani e le capacità 
umane si era ridotto di poco. Mezzi (sia linguistici sia 
cognitivi) molto più limitati sarebbero stati sufficienti per 
vivere cento o duecento millenni fa. E in nessun’altra 
specie un evento repentino e inspiegabile produsse un 
aumento delle facoltà cognitive (o di altro genere) tanto 
superiore a quello di cui la natura avrebbe bisogno. 

Se escludiamo i normali processi di selezione e le versioni 
magiche della evo-devo, cosa ci resta? La risposta è che ci 
restano due cose: le parole e le loro conseguenze a livello 
neurale. L'invenzione - perché poté trattarsi solo di 
un'invenzione, per quanto non cosciente o non intenzionale 
- di unità simboliche ebbe delle conseguenze cruciali per il 
cervello, mettendogli a disposizione un genere di materiale 
con cui non era mai entrato in contatto prima. Questo, 
insieme alle sue ramificazioni, sarà il tema portante che ci 
accompagnerà per larga parte di questo capitolo e del 
prossimo. Il punto di partenza è il dislocamento. 
Quest'ultimo ha offerto un modo, forse il solo modo, 


attraverso il quale è stato possibile raggiungere il 
simbolismo. 


LIMPORTANZA DEL DISLOCAMENTO 


La scelta del dislocamento come strada maestra per 
addentrarsi nel linguaggio può sorprendere alcuni lettori. Il 
dislocamento non è la prima cosa a cui pensa la maggior 
parte delle persone, quando si tratta di prendere in 
considerazione le proprietà che contraddistinguono in 
maniera chiara il linguaggio. Larbitrarieta è una scelta 
molto più frequente, e si trova infatti ovunque nel 
linguaggio. Eccezion fatta per una manciata di elementi 
onomatopeici, le parole non hanno alcuna relazione con 
l'oggetto che simboleggiano, come molti casi familiari 
rendono evidente (per esempio, lo stesso animale 
domestico è realizzato in modo diverso in lingue tra loro 
molto vicine: perro in spagnolo, chien in francese, Hund in 
tedesco e cane in italiano). Quello del cane è un esempio 
interessante, perché uno dei suoi attributi non solo si 
presta all’onomatopea, ma ha di fatto prodotto 
un'espressione onomatopeica: bau bau. Ma essa non si è 
mai imposta al di fuori del linguaggio infantile o del 
maternese, e latrato viene reso nelle varie lingue con 
termini altrettanto non onomatopeici: ladrido in spagnolo, 
aboiement in francese e bellen in tedesco. 

Larbitrarieta, tuttavia, non è propria della sola 
comunicazione umana. Per esempio, i segnali che usano i 
cercopitechi e i polli per indicare la presenza di un 
predatore aereo non hanno alcuna somiglianza reciproca, 
né assomigliano ai suoni o all'aspetto dei falchi o delle 
aquile. Inoltre l'abbandono dell’arbitrarietà lascerebbe 
comunque intatta una lingua: Il bau bau fa bau bau rispetta 
tutte le regole rilevanti non lessicali dell’italiano. 


Il simbolismo (cfr. Deacon 1997) sarebbe una scelta 
migliore per individuare la caratteristica distintiva del 
linguaggio. Al contrario delle unità della comunicazione 
animale, che si riferiscono (sempre che si possa parlare di 
riferimento in questo caso) direttamente a oggetti 
particolari o eventi nel mondo reale, le parole si riferiscono 
a cose attraverso la mediazione di concetti mentali di classi 
generali di entità e comportamenti (Saussure 1959). Cane 
non si riferisce a nessun individuo particolare e correre a 
nessun particolare atto del correre. Infatti ci si può riferire 
a un cane particolare soltanto se a cane si aggiungono delle 
informazioni specifiche che lo identifichino. In altre parole, 
il simbolismo implica una concatenazione di unità, proprio 
come la comunicazione animale implica l’assenza di una 
tale concatenazione. La domanda allora è: in che modo è 
stato possibile raggiungere il simbolismo? A differenza del 
dislocamento, il simbolismo non ha precedenti in nessun 
altro organismo: gli esseri umani sono davvero l’unica 
«specie simbolica». Eppure, qui sosterrò che il 
dislocamento è forse l’unica via al simbolismo. 

Seguendo la scrupolosa trattazione di Deacon (1997), 
dobbiamo innanzitutto prendere in considerazione le 
diverse classi di segnali. Il primo che le ha affrontate in 
maniera sistematica fu Peirce (Buchler 1955), la cui 
«originale distinzione tra icone, indici e simboli si basa sul 
fatto che un’“icona” ha una somiglianza fisica con l’oggetto 
a cui si riferisce, un “indice” è associato a un oggetto nel 
tempo e nello spazio, mentre un “simbolo” si basa su una 
convenzione sociale o su un accordo implicito» (Cangelosi 
2001, p. 93). Ma il genere di simbolismo che troviamo nel 
linguaggio presuppone molto di più. Cangelosi, al pari di 
molti altri filosofi e psicologi, si affida ripetutamente alla 
credenza che i simboli linguistici si riferiscano in maniera 
diretta a oggetti del mondo reale invece di riferirsi a essi in 
maniera indiretta in virtù della mediazione dei concetti di 
quegli oggetti. Per esempio, mettendo a confronto il 


riferimento dei segnali di allarme dei cercopitechi con 
quello delle parole, egli scrive: «Le associazioni simboliche 
hanno una doppia relazione di riferimento, una sussiste tra 
il simbolo e l'oggetto, l’altra tra il simbolo stesso e gli altri 
simboli» (p. 94, corsivo mio). Basterebbe questo per 
avanzare dei dubbi sulla sua pretesa di essere arrivato a 
spiegare il simbolismo attraverso una serie di esperimenti 
di simulazione computerizzata. 

Gli «organismi» virtuali di Cangelosi hanno già in 
dotazione gli strumenti per costruirsi un vocabolario - in 
questo caso, un codice binario che consiste di un numero 
finito (e ridotto) di bit. Tali organismi costruiscono una 
serie di possibili parole sulla base di trasformazioni di 0 e 
1. A essi viene quindi assegnato il compito di trovare 
(attraverso un procedimento per tentativi ed errori) una 
distinzione tra funghi velenosi e funghi innocui e, alla fine, 
di andare nella direzione di una designazione condivisa per 
ciascuna delle due classi. Un esperimento successivo di 
Cangelosi dovrebbe mostrare una progressione dalla 
simbolizzazione di caratteristiche specifiche alla 
simbolizzazione di intere categorie. Ma questi esperimenti 
non avrebbero funzionato senza l’assunzione che gli 
organismi virtuali avevano almeno un’idea del fatto che i 
segni possono rappresentare delle classi astratte, o delle 
categorie, di cose invece che un individuo particolare. Che 
le cose stiano così sembra ovvio a degli esseri umani, 
poiché dal primo all’ultimo respiro tutti gli esseri umani 
vivono in un mondo che trabocca di simbolismo. 
Difficilmente potrebbe essere altrimenti per una specie che 
possiede il linguaggio, che è interamente simbolico. 

Di conseguenza, per noi è molto difficile sbarazzarci 
dell'idea che la rappresentazione simbolica sia in qualche 
modo naturale e non richieda alcuna spiegazione speciale. 
La credenza tacita che gli altri animali vedano lo stesso 
mondo che vediamo noi - un mondo pieno di oggetti 
potenzialmente nominabili e di eventi per i quali 


semplicemente non hanno ancora trovato dei nomi - spiega 
forse molto della credenza, manifestata spesso, che un 
mero aumento nelle dimensioni del cervello o 
nell’intelligenza o nella complessità sociale o nella 
comprensione delle intenzioni altrui (la Teoria della Mente) 
sarebbe stato sufficiente per dare inizio al linguaggio. Ma 
nulla nell’etologia o nell’ecologia o nella biologia o nella 
psicologia comparata supporta l’idea che, per gli altri 
animali, il mondo sia fatto di un insieme di categorie 
discrete potenzialmente nominabili. Se un concetto che 
rappresenta una specie animale X può affiorare nella mente 
solo a due condizioni - o quando una qualche 
manifestazione fisica di X (o qualcosa di strettamente 
connesso a X) lo innesca o quando è sollecitato in maniera 
accidentale da una qualche attività cerebrale -, allora non 
c'è modo per un non-umano neppure di concepire la 
possibilità che un suono o un gesto completamente 
arbitrari possano essere l’etichetta permanente che sta per 
una qualche classe di entità. 

La distinzione tra «l’essere senza nomi» della Umwelt di 
tutte le altre specie e «l'essere piena di nomi» della 
Umwelt degli esseri umani è troppo netta perché ci sia 
stata una transizione senza passaggi intermedi (un fatto 
che non viene considerato da Deacon 1997, il quale 
immagina che il simbolismo emerga in maniera diretta dai 
comportamenti specifici umani). Solo il dislocamento è in 
grado di fornirci quei passaggi intermedi. 

Per i preumani privi di linguaggio, i segnali per 
comunicare avrebbero potuto essere soltanto iconici (come 
mostrare i denti per indicare che si è pronti a mordere) o 
indicali (come l’avvertimento della presenza di un 
predatore rappresentante un pericolo immediato). Questi 
segnali, per loro stessa natura, possono relazionarsi solo 
con dei fenomeni fisicamente presenti. Come. inizio, 
l'introduzione del dislocamento fu gia una grande 
rivoluzione. Il dislocamento ruppe la barriera del qui-e-ora, 


ma cio che indicava erano ancora entita del mondo reale e 
non classi concettuali. E come si è detto, solo poche specie 
erano riuscite a raggiungere tutto questo - e soltanto 
quando furono obbligate a farlo sulla spinta di bisogni 
pressanti provenienti dal loro ambiente. 

Se c’erano solo segnali iconici o indicali, in che modo si è 
potuto raggiungere il dislocamento? Ancora una volta, 
dobbiamo guardare a quello che fanno api e formiche. 
(Holldobler e Wilson 2009 è probabilmente la migliore 
panoramica prodotta di recente sull'argomento). I segnali 
delle formiche sono abbastanza chiari e lineari: la 
presentazione di campioni di cibo è iconica, mentre la corsa 
in tandem e le scie chimiche sono indicali. I segnali delle 
api mellifere sono piuttosto complessi; e mentre alcuni 
ritengono che si siano evoluti a partire da segnali più 
semplici usati da altre specie di api come i bombi 
(Dornhaus e Chittka 1999), in molti vorrebbero sapere di 
più sulla loro evoluzione, dal momento che la relazione che 
intrattengono con i loro referenti è più astratta (e dunque 
più simile a quella dei simboli) di ogni altra cosa che non 
sia già linguaggio. (Per un esame critico si veda Dyer 
2002). Alcuni segnali sembrano mischiare sia elementi 
iconici sia elementi indicali - come per esempio la danza 
scodinzolante, che indica la distanza relativa tramite la 
lunghezza della sua traiettoria dritta (elemento iconico) e la 
direzione tramite la relazione tra il suo asse e il sole 
(elemento indicale). Poiché la danza ha luogo in un posto in 
cui il sole non è visibile, l’ultimo elemento è spiegabile solo 
se le api moderne discendono da una specie che eseguiva la 
danza all'aperto (Dyer 2002). Possiamo perciò assumere 
che un mix di segnali iconici e indicali venisse usato anche 
dai primi ominidi che praticavano la saprofagia conflittuale. 

La rarità di elementi iconici e indicali nel linguaggio 
odierno, naturalmente, non è indicativa di quanto essi 
fossero frequenti nei primi stadi dello sviluppo. Riguardo al 
dislocamento, il punto centrale è che qualsiasi tipo di 


segnale usato in condizioni in cui il referente non sia 
percepibile da nessuno dei sensi ha gia acquisito la 
proprietà più importante del simbolismo: la capacità di 
evocare dei fenomeni che stanno al di fuori del campo 
sensoriale del destinatario. 

Che cosa avrebbero potuto trasmettere quei primi 
segnali? Meglio: che cosa sarebbe stato preferibile ai fini 
del reclutamento? Come nel caso delle formiche, sarebbe 
stato utile dare un’idea di quale genere di cibo ci si dovesse 
aspettare, e in questo caso la natura della carcassa avrebbe 
potuto essere indicata imitando i suoni caratteristici o la 
postura della specie in questione. Se i membri del gruppo 
di reclutamento fossero ritornati immediatamente alla 
carcassa, sarebbe stato d’aiuto qualcosa come la corsa in 
tandem. Altrimenti, bisognava dare indicazione della 
direzione, e la distanza - o per lo meno l'indicazione 
«vicino» piuttosto che «lontano» - sarebbe stata 
d’incoraggiamento. Dei suoni o dei gesti caratteristici 
avrebbero potuto esprimere comandi come «Corri!» o 
«Dillo agli altri». 

Per quanto concerne l’estensione del vocabolario, vale la 
pena di notare che alcuni recenti lavori nel campo della 
robotica supportano la tesi che, una volta comparso un 
primo vocabolario ridotto, le parole rilevanti per i 
comportamenti associati a quel vocabolario sarebbero 
aumentate spontaneamente. Schulz et al. (2011) e Heat et 
al. (2012) riferiscono di piccoli robot (i «lingodroidi») che, 
avendo la capacità di proferire sillabe e comunicarsele 
reciprocamente, hanno sviluppato un loro vocabolario per 
la divisione del tempo e la distanza. Ma naturalmente, 
anche se dotato di tali estensioni, l’emergente proto- 
linguaggio sarebbe stato soltanto poco più sofisticato dei 
«linguaggi» delle formiche o delle api, i quali non sono mai 
stati usati al di fuori del contesto originario del 
foraggiamento. Sembra infatti probabile che, per un 
periodo di tempo considerevole, quanto abbiamo descritto 


fosse tutto cio che c’era - un mezzo puramente funzionale, 
proprio come la comunicazione dislocata delle formiche e 
delle api, strettamente legato al suo contesto specifico, 
quello della saprofagia conflittuale. Anche se si usava un 
suono simile al barrito dei mammut, esso non avrebbe 
indicato i mammut in generale (come invece farebbe una 
parola moderna), ma semplicemente «un particolare 
mammut morto», quello che si trovava in quel luogo in quel 
momento. Ma in una specie dotata di un cervello di 
dimensioni pari a quello di una scimmia, le cose non 
potevano restare così per sempre. 

Questo è il punto più lontano nella spiegazione di questi 
fenomeni al quale ci possono portare la convergenza 
evolutiva e le somiglianze nella costruzione della nicchia. 
Specie che occupano delle nicchie simili, e adottano 
soluzioni simili per risolvere i problemi sollevati da quelle 
nicchie, si differenzieranno nei loro successivi 
comportamenti sulla base delle diverse capacità che 
portano con sé nella propria nicchia. Al contrario delle api 
e delle formiche, e al pari invece degli altri primati, i 
preumani avevano una personalità individuale da cui 
scaturivano delle ampie variazioni nel comportamento. I 
preumani avevano dei concetti (di un qualche tipo), le api e 
le formiche no. I preumani avevano dei cervelli di diversi 
ordini di grandezza più grandi dei cervelli delle formiche o 
delle api. Perciò le conseguenze dell’adozione di un tratto 
proto-linguistico come il dislocamento difficilmente 
potevano essere le stesse per i preumani e per le api e le 
formiche. 

Consideriamo molti dei fattori causali proposti per 
spiegare l’origine del linguaggio: la produzione di utensili, 
le strategie sociali, la scelta della femmina, il controllo dei 
piccoli, e così via - tutte cose che non interessavano alle 
api o alle formiche. Mentre nessuna di esse fu sufficiente 
per dare il via al linguaggio, compiuto il passo iniziale 
ciascuna di esse avrebbe alla fine contribuito al suo 


sviluppo. Una volta compreso che un suono o un gesto può 
rappresentare un’entità o un’occorrenza localizzate al di 
fuori del campo sensibile, quell'idea sarebbe stata 
sviluppata in molti modi. Uno è la pedagogia: mettere al 
corrente i propri piccoli dei pericoli non immediatamente 
presenti, ma che avrebbero potuto avere un impatto 
drammatico per le loro chance di sopravvivenza in futuro. 
Si possono raccontare molte storie ad hoc di questo tipo: 
per esempio, un padre che indica un particolare tipo di 
impronta e fa il segno che sta per «tigre», qualunque esso 
fosse. Altre motivazioni possono aver aiutato a espandere il 
vocabolario, come per esempio acquisire prestigio 
attirando per primi l’attenzione su un qualche nuovo evento 
o circostanza (Dessalles 2000, 2009) - una possibilità che, 
suggerisce Dessalles (2010), può essere una strategia 
evolutiva stabile nel senso di Maynard Smith e Price 
(1973). Tuttavia, possiamo avere solo dei resoconti ipotetici 
di come si sia sviluppato il primo vocabolario. 


DALLA COGNIZIONE PREUMANA A QUELLA UMANA 


Ci muoviamo su un terreno più stabile quando 
consideriamo le conseguenze che lo sviluppo del proto- 
linguaggio avrebbe avuto sul cervello preumano. Prima ho 
suggerito che, di per sé, potrebbero non esserci differenze 
tra i concetti umani e quelli non umani; eppure, grandi 
differenze nel comportamento cognitivo potrebbero 
comunque emergere nel momento in cui tali concetti 
possono essere richiamati alla mente ed essere connessi fra 
di loro. Cominciamo considerando le realizzazioni dei 
concetti nei cervelli umani. 

I concetti (umani o non umani) devono avere come base 
dei dati percettivi opportunamente distribuiti; ma sono 
anche archiviati soltanto come distribuzioni di tali dati? Per 
fare un esempio concreto, prendiamo il concetto 


«leopardo». Esso potrebbe non essere altro che una mera 
collezione di dati sparsi sui leopardi, con le forme e i colori 
archiviati nelle aree del cervello deputate a processare 
l'informazione visiva, i suoni nelle aree deputate 
all'informazione uditiva, e così via (Allport 1985; Saffran e 
Schwartz 1994; Martin 2007). Tuttavia, se è tutto qui, 
diventa difficile spiegare in che modo si possano avere 
delle generalizzazioni di ordine superiore tra i concetti (e 
cioè come si creino connessioni tra concetti che abbiano 
solo uno o due elementi in comune). Una soluzione può 
essere offerta dalle «zone di convergenza» proposte da 
Damasio (1989; Damasio et al. 1996), ulteriori aree del 
cervello in cui vengono archiviati i concetti con 
caratteristiche sensoriali e funzionali simili. Un'altra 
proposta è che le diverse rappresentazioni prodotte dalle 
singole aree vengano poi connesse in un qualche punto 
centrale, chiamato «hub» (Patterson et al. 2007), di modo 
che la rappresentazione propria di ogni concetto intero 
(oltre alla sua base percettuale che è distribuita su aree 
diverse) possieda un proprio locus specifico - i loci sono, a 
loro volta, raggruppati sulla base della somiglianza 
semantica (Riddoch et al. 1988; Caramazza et al. 1990). In 
effetti, queste teorie non si escludono a vicenda, dal 
momento che il cervello opera con una certa ridondanza, e 
non si vede quindi perché non potrebbero esserci sia un 
hub dei concetti, nel quale vengono centralizzate tutte le 
rappresentazioni percettive distribuite su diverse aree, sia 
delle zone di convergenza, dove i concetti vengono 
raggruppati sulla base delle loro qualità comuni. 

Secondo una fonte (Chater e Hayes 1994), non ci sono 
mezzi operativi per separare la conoscenza concettuale da 
quella lessicale; di conseguenza, non c’è modo di 
determinare la natura dei concetti di una specie priva di 
linguaggio, né c’è modo di determinare se le altre specie 
abbiano dei concetti - per quanto sembri improbabile che 
non ne abbiano. Altri guardano all'attuale stato del 


problema come al risultato della negligenza degli scienziati 
cognitivi: «Con la possibile unica eccezione degli psicologi 
dello sviluppo ... tipicamente, nella scienza cognitiva, ci si è 
interessati poco ad analisi comparative delle somiglianze e 
delle differenze nel comportamento concettuale tra gli 
umani e gli altri animali» (Zentall et al. 2008, p. 13). Nello 
stesso studio si sostiene che sulla base dell’analisi critica di 
un'ampia gamma di studi sperimentali ci siano «buone 
prove del fatto che, probabilmente, molte specie di animali 
possiedono alcune delle capacità concettuali che in genere 
sono state ritenute appannaggio dei soli esseri umani» (p. 
4). 

Evidenze provenienti da altri ambiti - studi sull’efficienza 
delle connessioni cerebrali (per esempio, Cherniak 2005; 
Cherniak et al. 2002) - supportano l’idea che i concetti 
degli animali possano perfino avere la stessa struttura dei 
concetti umani. Immaginate un cervello che rappresenti i 
concetti solo in modalità distribuita. Poiché una delle molte 
funzioni del cervello è di assicurare che chi lo possiede 
risponda in maniera appropriata ai cambiamenti 
dell'ambiente, ciascuna delle rappresentazioni percettuali 
di un qualche aspetto del concetto - per esempio, il suono, 
l'odore, la vista o il movimento di un leopardo - dovrebbe 
essere connessa a ciascuna delle altre per poter assicurare 
che uno stimolo qualsiasi percepito in un dato momento sia 
causato effettivamente da un leopardo e non da qualcosa 
che, da una certa angolatura o da una certa distanza, 
assomiglia a un leopardo o emette versi simili a quelli di un 
leopardo. Inoltre, se non c’è un hub, ciascuna di queste 
rappresentazioni dovrebbe essere connessa in maniera 
separata alla risposta motoria appropriata per il 
riconoscimento dei leopardi (scappa, nasconditi, sali su un 
albero, aspetta e vedi che succede, ecc.). È facile 
immaginare quale ingarbugliata matassa di connessioni 
neurali ne risulterebbe. Connettere invece ogni 
rappresentazione a un hub, e poi dall’hub a ogni 


meccanismo di risposta, ridurrebbe drasticamente sia la 
quantita sia la complessita delle connessioni, oltre a ridurre 
i tempi di reazione in un modo che garantisce meglio la 
sopravvivenza. 

Se i concetti dei non-umani hanno piu o meno la stessa 
struttura dei nostri, allora, come è già stato detto, ciò che 
manca e rende conto della disparità cognitiva potrebbe 
essere o la capacità di recuperare i concetti o quella di 
connetterli tra loro, oppure entrambe le cose. Assumiamo 
che sia così. Perché le parole dovrebbero cambiare le cose? 
Ricordiamo una citazione cruciale già proposta nel capitolo 
1: «Se si potesse provare che alcuni elevati poteri mentali, 
come la formazione di concetti generali, l’autocoscienza, 
ecc. sono assolutamente peculiari all'uomo, il che sembra 
estremamente dubbio, non sarebbe improbabile che queste 
qualità apparissero come il risultato incidentale di altre 
facoltà intellettuali altamente avanzate e queste ancora 
principalmente il risultato dell'uso continuo di un 
linguaggio perfetto» (Darwin 1871, p. 101 [trad. it. p. 106] 
corsivo mio). L'espressione «uso continuo» deve essere 
stata il frutto di una brillante intuizione, perché dubito che, 
date le conoscenze di centoquarant’anni fa, Darwin potesse 
anche solo sognarsi di spiegare come il linguaggio avrebbe 
avuto un tale effetto. Ma ora siamo in grado di supportare 
questa intuizione. 

Diamo un'occhiata a come e perché i concetti possono 
essere innescati in assenza dei segnali simbolici. Per fare 
un esempio concreto, consideriamo un leone e la sua preda. 
La preda vede il leone, la cui comparsa innesca nel cervello 
della preda le rappresentazioni visive, il che, a sua volta, 
innesca il riconoscimento del leone - o, più precisamente, 
la rappresentazione «leone, alla distanza X, si muove nei 
dintorni, non sembra interessato». I neuroni che sono l’hub 
del concetto «leone» si attivano e la loro sollecitazione è 
sufficiente a innescare i neuroni motòri responsabili della 
risposta «aspetta e vedi che succede». Il leone se ne va. È 


presumibile che anche il concetto svanisca. Che cosa 
potrebbe farlo tornare, se escludiamo che il leone compaia 
di nuovo? Non c’é bisogno che la preda evochi il concetto in 
assenza di un qualche leone. Lattivita del cervello potrebbe 
innescare di nuovo per caso il concetto di leone, come 
presumibilmente avviene nei sogni. Ma è possibile che la 
preda richiami alla mente quel concetto intenzionalmente, 
come un bambino è già in grado di fare attorno ai tre anni, 
anche solo per «pensare» ai leoni - come evitarli, dove 
trovarli, come ucciderne uno, se necessario, o altro? Non è 
chiaro se nei non-umani ci sia un meccanismo in grado di 
fare questo. 


QUELLO CHE LE PAROLE POSSONO FARE 


Consideriamo ora le parole. I proferimenti dei primi 
segnali che si riferiscono a oggetti dislocati (non presenti) 
avrebbero avuto luogo in vari stadi dello scenario della 
saprofagia e in un primo momento sarebbero stati 
strettamente legati a essi - proprio come, per esempio, per 
i cercopitechi il segnale d’allarme «leopardo» è legato alla 
comparsa effettiva dei leopardi. Ma, come ho suggerito in 
precedenza, un progressivo aumento del loro uso in una 
sempre maggiore varietà di contesti avrebbe 
progressivamente allentato le associazioni tra il segnale e 
la saprofagia, convertendolo a poco a poco (questo 
processo potrebbe essere durato diversi millenni) da 
segnale legato a un contesto a parola con funzione 
simbolica e libera da legami contestuali. Come è evidente 
sulla base dell'esperienza quotidiana, ed è stato più volte 
dimostrato dalla neurologia sperimentale (per esempio, 
Kroll e Curley 1988; Klinger et al. 2000), le 
rappresentazioni delle parole e i concetti a esse associati 
sono legati in maniera molto stretta. Il proferimento di una 
parola può evocare simultaneamente tutte le proprietà 


semantiche di quella parola: i posti dove si trovano i leoni 
(Africa, zoo), i suoni (ruggito), l’aspetto fisico (criniera, 
coda a ciuffo), e cosi via. Allo stesso modo, menzionare una 
di queste proprietà può evocare la parola «leone». «La 
conoscenza concettuale non pare slegata dalle sue origini 
percettive, né dalle sue origini linguistiche» (Boroditsky e 
Prinz 2008, p. 112). 

Come reagì il cervello al fatto di ricevere delle parole? Le 
parole erano qualcosa di completamente diverso da quanto 
aveva dovuto maneggiare in precedenza. Prima delle 
parole, i cervelli non dovevano interpretare nulla che 
provenisse dal loro stesso interno - un fatto semplice ma 
certo significativo, che pare essere stato ampiamente 
ignorato nella vasta letteratura su cervello e 
comportamento. Fino a quel momento, il cervello aveva 
avuto la funzione di «ricevere informazioni dai sensi, 
analizzarle e poi tradurle in comandi per i muscoli» 
(Marcus 2004, p. 11). I «sensi» naturalmente includono la 
propriocezione: rendersi conto di avere fame spinge ad 
andare in cerca di cibo. Ora, in talune circostanze, questo 
processo doveva essere bloccato: le risposte motorie 
appropriate alla comparsa effettiva di un leone non 
potevano venire innescate ogniqualvolta fosse evocato il 
concetto «leone» dalla parola che lo designava. Linibizione 
di alcune risposte motorie tipiche era accompagnata da 
cambiamenti nel flusso delle informazioni: invece di 
viaggiare sempre dagli organi di senso esterni verso le aree 
di associazione e poi alle aree motorie, a volte le 
informazioni viaggiavano da un’area di associazione 
all'altra (forse molte altre), senza innescare alcuna azione o 
mettendo semplicemente in moto gli organi dell’apparato 
fonatorio. 

Tutto ciò richiedeva tanto un vasto reindirizzamento delle 
connessioni afferenti e di quelle efferenti quanto un 
aumento appropriato (e in definitiva piuttosto grande) delle 
connessioni neurali. Questi fattori, a loro volta, portarono a 


un aumento per selezione delle dimensioni del cervello. Di 
sicuro, è significativo che un concreto aumento della 
dimensione del cervello (tale cioè da superare il normale 
rapporto di scala costante tra dimensioni del cervello e 
massa corporea) si riscontra in concomitanza con l’inizio 
della saprofagia conflittuale (circa due milioni di anni fa); 
ed è significativo che la neocorteccia, il luogo in cui si 
trovano le aree deputate alle associazioni, sia aumentata in 
proporzione più di ogni altra regione, fino a diventare 3,2 
volte più grande di quanto ci si aspetterebbe in rapporto 
alla massa corporea (Passingham 1975; Schoenemann 
2009). Si noti che sebbene l'aumento delle dimensioni del 
cervello umano possa essere stato reso possibile 
dall’introduzione della cottura dei cibi (Park et al. 2007), 
dalla presenza di un sistema di raffreddamento per il 
cervello stesso (Falk 1990) o da altre cause, nulla di tutto 
ciò spiega perché ci sia stato un aumento delle dimensioni. 
Spesso si sottovaluta troppo il fatto che rendere qualcosa 
evolutivamente possibile non garantisce di per sé in alcun 
modo che quella cosa evolverà. Se davvero lo garantisse, 
allora non sarebbe mai stato possibile allenare nessuna 
specie a eseguire un comportamento che essa non avesse 
già messo in campo in natura. 

Si noti anche che il proferimento di parole (possiamo ora 
cominciare a chiamarle così) doveva sottostare al controllo 
della volontà. I proferimenti volontari non erano una novità 
assoluta. Almeno a partire da Seyfarth e Cheney (1990) è 
noto che i segnali di avvertimento sono sotto il controllo 
volontario. (Per esempio, è meno probabile che gli animali 
si diano avvertimenti se non hanno nessun parente stretto 
nei paraggi e, se sono soli, sopprimono del tutto i segnali). 
Dato che in qualsiasi momento potrebbe sorgere il bisogno 
di usare una certa parola - non serve che qualcosa 
nell'ambiente inneschi l'attivazione dei neuroni nelle aree 
sensoriali e dia il via all’evocazione dei concetti -, la 


rappresentazione neurale delle parole doveva essere 
costantemente accessibile. 

Tutto questo è stato una condizione necessaria per il 
pensiero offline simile a quello umano. Tuttavia manca 
ancora una condizione sufficiente. Se l’unica cosa che si 
può fare è pensare in maniera libera a un leone quando non 
ci sono leoni in giro, il guadagno è poco o nullo. Perché 
possa avere inizio il pensiero offline, devono esserci delle 
connessioni neurali robuste tra un concetto e l’altro. 
C’erano queste connessioni nei predecessori dei non- 
umani? Sembrerebbe di no. Sia «leone» sia «leopardo» 
sarebbero probabilmente stati connessi a «correre», ma ci 
sono dei princìpi di economia che scoraggiano la 
formazione di connessioni ulteriori. «Poiché le connessioni 
nel cervello, in particolare quelle ad ampio raggio, sono 
una risorsa rigorosamente limitata, sia nel volume sia nei 
tempi di propagazione del segnale, minimizzare i costi delle 
connessioni neurali richieste è il principio guida 
dell'anatomia del sistema nervoso» (Cherniak 1994, p. 94). 
Una conseguenza delle limitazioni nelle connessioni tra 
concetti è che qualsiasi tipo di generalizzazione sul 
comportamento di leoni e leopardi - qualcosa che potrebbe 
avere chiaramente un valore per la sopravvivenza - viene 
reso impossibile. 

Le parole potrebbero aver creato le connessioni neurali 
necessarie. Il modo in cui è più probabile che si formino 
delle connessioni neurali, o si rafforzino ulteriormente 
quelle già esistenti, è sempre la Regola di Hebb: «Quando 
un assone della cellula A è abbastanza vicino da eccitare la 
cellula B, e prende ripetutamente parte alla sua 
eccitazione, hanno luogo, in una o in entrambe le cellule, 
dei processi di crescita o dei mutamenti strutturali tali da 
aumentare l’efficienza di A, in quanto cellula scatenante 
l’attività di B» (Hebb 2002, p. 62 [trad. it. p. 129]). 

Se si aggiunge a tutto questo la considerazione di Darwin 
sull’«uso continuo di un linguaggio perfetto» e la natura 


della costruzione della nicchia, nella quale dei 
comportamenti non supportati geneticamente modificano 
l’ambiente in modi che causano la selezione attiva di quegli 
stessi comportamenti, si inizierà a scorgere il primo 
rudimentale abbozzo di una macchina per avviare il 
comportamento cognitivo avanzato. Più le parole venivano 
usate insieme, più forti erano le connessioni che si 
sarebbero formate tra i concetti a esse associate. Più 
parole diverse venivano usate, più si ingrandiva la rete 
semantica che rendeva possibile il pensiero offline. 

Si noti, ancora una volta, che queste proposte si basano 
sull'idea che gli sviluppi evolutivi significativi siano 
cominciati nei cambiamenti di comportamento piuttosto 
che nei cambiamenti interni all'organismo. Il problema è 
semplicemente quello di mettere l'evoluzione dello sviluppo 
cognitivo umano sullo stesso piano dell'evoluzione delle 
altre novità uniche. Ai castori sono prima cresciuti i piedi 
palmati e soltanto dopo hanno adottato uno stile di vita 
acquatico, oppure hanno prima assunto quello stile di vita e 
soltanto dopo, gradualmente, hanno sviluppato dei piedi 
palmati? I pipistrelli hanno prima acquisito l’abilità di 
ecolocarsi e poi hanno iniziato a volare e cacciare di notte, 
oppure hanno prima sperimentato il volo e la caccia 
notturni (forse, dissuasi dal farlo di giorno dalla presenza di 
predatori) per poi aumentare gradualmente una qualche 
abilità nel produrre suoni e percepirne l’eco che già 
possedevano a livello minimale? La risposta è già lì, nei 
comportamenti comuni all’interno della nostra stessa 
specie. Le persone afflitte da cecità imparano velocemente 
a usare la punta dei loro bastoni per produrre suoni e a 
interpretarne l’eco per determinare approssimativamente 
la posizione degli ostacoli. Fortunatamente, non devono 
attendere che un qualche mutamento genetico li doti della 
capacità di ecolocarsi. Gli esseri umani (proprio come deve 
essere stato per gli antenati dei pipistrelli) non sono 
equipaggiati dalla genetica, o da qualche altra componente 


innata, per l’ecolocazione; ma non ci può essere il minimo 
dubbio che, se una qualche nuova malattia dovesse rendere 
cieca l’intera specie, le capacità minime preesistenti negli 
esseri umani per elaborare l’eco e localizzarne la fonte 
sarebbero selezionate in maniera massiccia; e allora 
comparirebbero, crescerebbero e migliorerebbero 
rapidamente dei meccanismi specializzati per queste 
capacità che verrebbero poi trasmessi geneticamente. 

Detto altrimenti: è il comportamento a guidare 
l'adattamento e non l'adattamento a guidare il 
comportamento. Nel caso del pensiero offline, la riluttanza 
ad accettare quella che è una legge valida in tutti gli altri 
casi dipende probabilmente dallo spettro persistente del 
dualismo. Vi è una tendenza a pensare che casi di 
adattamento come i piedi palmati dei castori e 
l’ecolocazione dei pipistrelli siano «fisici», e siano perciò 
diversi da quegli adattamenti come il pensiero offline che 
sono invece «mentali» - anche se poi l’ecolocazione dei 
pipistrelli include necessariamente un forte elemento 
computazionale (Roverud 1993; Neuweiler 2003), proprio 
come il pensiero offline richiede necessariamente delle 
strutture fisiche e dei processi nel sistema nervoso 
centrale. Il pensiero offline è tanto (o tanto poco) «fisico» 
come ogni altra cosa. 

Per quanto ciò che sto sostenendo qui possa suonare un 
po’ come il vecchio adagio secondo cui «il pensiero è 
impossibile senza linguaggio», non si tratta della stessa 
cosa. In primo luogo, ciò che esisteva allo stadio che sto 
descrivendo non era linguaggio. Era ancora soltanto un 
repertorio comunicativo incrementato che, poiché le sue 
unità sono diventate davvero simboliche, si potrebbe 
iniziare a descrivere come una forma di proto-linguaggio. 
In secondo luogo, ci sono molti generi di pensiero per i 
quali non è richiesto il linguaggio - compresi quei generi 
propri tanto degli esseri umani quanto di quegli animali che 
si collocano al di sopra di una certa (bassa) soglia di 


intelligenza. Quello che sto sostenendo è che un certo 
genere di pensiero probabilmente limitato agli esseri umani 
- il pensiero che manipola concetti di classi di entità 
piuttosto che di entità singole, che può andare al di là 
dell'esperienza per creare nuove configurazioni genuine - 
aveva bisogno di un qualche genere di oggetto pubblico 
(segnali o parole) per poter iniziare. Qualsiasi approccio 
dinamico e basato sui processi e non essenzialista 
riconosce che quella che potrebbe essere una necessità 
cruciale nei primi stadi di un processo può poi essere 
completamente abbandonata a uno stadio successivo - 
proprio come le impalcature attorno a una casa in 
costruzione. Anche se le parole potrebbero essere state 
necessarie per dare inizio al pensiero offline, non c’è 
ragione di dubitare che i concetti abbiano potuto in seguito 
sviluppare una connessione hub-hub senza la mediazione 
delle parole. Infatti, poiché l'attivazione simultanea degli 
hub dei concetti segue automaticamente dall’attivazione 
simultanea dei gruppi di neuroni che rappresentano le 
parole a essi associate, sembra inevitabile che si arrivi a 
una connessione diretta concetto-concetto (che rende le 
parole superflue per il pensiero). Siamo così in grado di 
bypassare l’apparentemente infinito dibattito sollevato 
dalla domanda se vi sia o no un «linguaggio del pensiero» 
che, in misura variabile, mimi il linguaggio esternalizzato 
(si veda Aydede 2010 e le fonti da lui citate). Il pensiero 
offline può (oggi) essere trasmesso con o senza l’uso del 
linguaggio, eccezion fatta per un piccolo insieme di 
universali sintattici che non riflettono la sintassi di nessuna 
lingua particolare (si veda la discussione nel capitolo 5), ma 
la struttura alla base di tutte le lingue. Tuttavia, senza un 
comportamento linguistico pubblico all’inizio, non avrebbe 
potuto esistere nulla che si avvicini al «linguaggio del 
pensiero» o a un qualsiasi genere di pensiero offline. 

Sono fin troppo consapevole che quanto si sostiene in 
queste pagine è altamente speculativo, e deve rimanere 


tale in attesa di nuovi studi. Tuttavia, come gia detto, di 
ricerca sulla relazione tra concetti umani e non umani se 
n’é fatta ahimè assai poca; di conseguenza, qualsiasi 
tentativo di spiegazione, per quanto ipotetico - o scorretto, 
per quel che conta - è meglio dello stato di cose presente. 
È auspicabile che il resoconto proposto qui irriti a 
sufficienza gli specialisti in questo campo perché provino a 
confutarlo. A quel punto potremo davvero imparare 
qualcosa. 


IL PROTO-LINGUAGGIO 


I processi visti finora avrebbero avuto inizio con 
l'estensione di un repertorio di segnali nella direzione del 
dislocamento - qualcosa che, a quello stadio, non era 
distinguibile dai «linguaggi» strettamente legati al contesto 
propri delle api e delle formiche -, trasformandolo nel 
tempo in ciò che potremmo legittimamente chiamare un 
proto-linguaggio. Alcuni studiosi addirittura respingono 
l’idea che un proto-linguaggio sia possibile. Piattelli- 
Palmarini (2010, pp. 160-61) afferma che «è molto difficile 
anche solo definire le parole in assenza di ... criteri 
sintattici» (corsivo nell’originale) e si domanda come 
potrebbe mai esistere un proto-linguaggio «una volta che le 
parole così come noi le conosciamo siano private della loro 
struttura interna e della loro valenza composizionale» 
(corsivo mio). Fate attenzione alle parti in corsivo nella 
seconda citazione. È assai irrealistico supporre che, da uno 
a due milioni di anni fa, le «parole» potessero essere in 
qualche modo simili alle parole delle lingue moderne usate 
da un adulto. Piattelli-Palmarini non ha che da guardare 
alle fasi iniziali di un qualsiasi pidgin (Bickerton 1981) per 
trovare qualcosa esattamente simile alle parole del proto- 
linguaggio - ovvero non combinate in nessuna struttura 
grammaticale. I parlanti adulti moderni possono essere, 


come dice lui, «delle entita completamente sintattiche»; ma 
assumere che lo fossero anche i loro antenati significa 
sostenere una visione essenzialista della natura, cosa del 
tutto contraria a un approccio evoluzionista. 

Una tale posizione obbliga anche ad assumere o che la 
sintassi abbia preceduto le parole oppure che parole e 
sintassi siano emerse contemporaneamente. Se la sintassi 
ha preceduto le parole, deve essere stata utilizzata prima 
per qualcosa che non fosse il linguaggio - una proposta di 
questo tipo è stata avanzata anni fa (Hauser et al. 2002), 
ma è rimasta finora priva di conferme empiriche. Se la 
sintassi e le parole sono emerse contemporaneamente, 
nessuno ha mai provato a spiegare come o perché ciò sia 
accaduto. Da un punto di vista evolutivo, pare ovvio che le 
parole siano venute prima, ma che possedessero soltanto 
una piccola parte delle proprietà delle parole moderne, che 
la loro comparsa abbia accelerato i tempi per l'avvento 
della sintassi e che la loro conseguente interazione con la 
sintassi abbia dato origine all'insieme di proprietà delle 
parole odierne che Piattelli-Palmarini elenca correttamente, 
ma misinterpreta. 

Un altro scettico sul proto-linguaggio è Botha (2012), il 
quale non trova per nulla convincente il resoconto dei 
«fossili viventi» del proto-linguaggio che viene presentato 
in Bickerton (1990b) - le fasi iniziali del pidgin, i 
proferimenti delle scimmie addestrate, le prime fasi del 
linguaggio infantile e il modo di parlare dei «ragazzi 
selvaggi» come Genie. Egli ha ragione almeno su una di 
queste categorie (le prime fasi del linguaggio infantile), 
come mostreremo nel capitolo 7. Ma le sue argomentazioni 
non colgono nel segno, dal momento che la motivazione 
principale a favore del proto-linguaggio non si è mai basata 
sull'esistenza di «fossili viventi», ma sull’inevitabilità logica 
di quel mezzo. Come notavo in Bickerton (1990b, capitolo 
6), le parole devono aver preceduto la sintassi; le parole 
dovevano essere concatenate per produrre delle 


proposizioni dotate di significato, e senza la sintassi non 
sarebbe stato possibile combinarle [merge] in coppie (come 
si sarebbe saputo cosa accoppiare?), ma avrebbero potuto 
solo essere affiancate l’una all’altra in serie, come delle 
perline su un filo. Il proto-linguaggio poteva consistere 
soltanto di brevi proferimenti (di solito non più lunghi di un 
numero di unità compreso fra le tre e le cinque), non 
perché ci fosse un limite massimo fissato per questo 
processo (una castroneria ripetuta in Chomsky 2005, 2010 
e Berwick e Chomsky 2011, nonostante nessuno l’abbia mai 
sostenuta), ma perché, con l’allungarsi dei proferimenti 
privi di sintassi, le possibili ambiguità crescevano in modo 
esponenziale. 

Nonostante (per ragioni ancora controverse) abbiano poi 
perso terreno nei confronti degli esseri umani, i 
Neanderthal, la specie a noi più vicina, avevano dei cervelli 
mediamente più grandi dei nostri (Stringer e Gamble 
1993). Si è tentati di ipotizzare che tale aumento fosse 
avvenuto perché ai Neanderthal, ai quali ancora mancava 
la capacità di un linguaggio pienamente dotato di sintassi, 
servissero più cellule cerebrali per computare tutti i 
possibili significati generati dal tentativo di creare 
proferimenti proto-linguistici piuttosto lunghi. Ovviamente, 
si tratta di pura speculazione, ma è in accordo con lo 
schema generale di sviluppo cognitivo e culturale di Homo: 
la relativa stagnazione culturale del periodo a cavallo tra i 
2,5 e gli 0,3 milioni di anni fa e la cascata di innovazioni 
tecnologiche che sono venute immediatamente dopo. È 
inoltre compatibile con il bisogno, sorto in seguito 
all'emergere del dislocamento, di un lungo periodo di 
ristrutturazione del cervello, prima che si potesse 
sviluppare un linguaggio dotato di sintassi. Questo 
suggerisce un periodo compreso tra uno e due milioni di 
anni durante il quale il proto-linguaggio incrementò il 
proprio vocabolario in maniera graduale e, da repertorio 
comunicativo incrementato inizialmente usato solo nel 


contesto della saprofagia conflittuale, divenne un sistema 
completamente simbolico, ma senza passare attraverso 
altri cambiamenti significativi. 

In altri lavori (Bickerton 2009, pp. 65-70; Arbib e 
Bickerton 2010), ho discusso a lungo il problema se il 
proto-linguaggio fosse di tipo composizionale e dotato di 
unita pressoché equivalenti alle moderne parole - come 
assumono Bickerton (1990b), Pinker (1994), Jackendoff 
(1999, 2002), Tallerman (2007) e altri - oppure olofrastico 
e dotato di unita pressoché equivalenti alle moderne frasi - 
come è stato proposto da Wray (1998, 2000), Fitch (2000), 
Arbib (2005) e altri. In questa sede, possiamo 
semplicemente assumere che il resoconto composizionale 
sia corretto, dal momento che la scomposizione delle 
olofrasi in singole parole presuppone una comprensione del 
simbolismo - possiamo assumere che un pezzo arbitrario di 
una olofrase rappresenterebbe, in linea di principio, il 
concetto di un’entita o di un evento. Non abbiamo evidenze 
a supporto di questo e, come si è visto, tutto lascia 
supporre che, prima dell'avvento del linguaggio, nessun 
animale avesse la benché minima idea della possibilità di 
un riferimento simbolico. 


DOPO IL PROTO-LINGUAGGIO 


Sebbene la costruzione delle infrastrutture necessarie al 
linguaggio avrà richiesto diverso tempo, la transizione dal 
proto-linguaggio al linguaggio potrebbe essere stata 
relativamente rapida, collocandosi con ogni probabilità 
all’interno del processo di transizione dalla specie 
immediatamente precedente agli esseri umani agli umani 
anatomicamente moderni. È lecito chiedersi se non sarebbe 
stato possibile un cambiamento più lungo e graduale. Non 
c'è una risposta chiara a questa domanda, ma non sembra 
ci siano molte probabilità a favore di questa opzione. Non 


esiste una condizione intermedia tra la concatenazione di 
parole come perline su un filo e la loro concatenazione sulla 
base di una progressiva combinazione [merge] in coppie. 
Fintanto che il meccanismo non era del tutto attivo e 
funzionante, interpretare il messaggio sulla base del 
«Vecchio» metodo (nel quale le parole venivano inviate 
singolarmente all'apparato fonatorio) era probabilmente 
più sicuro che interpretarlo sulla base del «nuovo» metodo 
(nel quale locuzioni e frasi venivano assemblate prima nel 
cervello). Il «nuovo» metodo, se funzionava bene, era 
automatico e molto più veloce di quello «vecchio». Ma se 
non funzionava, era facile che venissero fuori messaggi 
alquanto ingarbugliati e confusi. 

La mia proposta è che l’infrastruttura sintattica sia stata 
il prodotto di un'’attività auto-organizzata avvenuta 
all’interno del cervello stesso. Lungi dall'essere una 
struttura statica, «la corteccia ha una natura dinamica, sia 
nell’arco della vita di un individuo sia nell’arco della vita di 
una specie» (Krubitzer 1995, p. 414, corsivo mio; si veda 
anche Kaas 1987). Per illustrare il tipo di corso intrapreso 
da tale dinamismo, considerate tre specie, delle quali una 
(la talpa dal muso stellato) ha un senso dell'olfatto 
ipersviluppato, come molti altri mammiferi, mentre le altre 
due (il pipistrello fantasma e l’ornitorinco) hanno modalità 
sensoriali - rispettivamente, l’ecolocazione e 
l’elettroricezione - in comune con poche altre specie 
(Krubitzer 1995, figura 2). Nell’architettura cerebrale 
generale dei mammiferi, che è rimasta essenzialmente 
intatta fin dai primi mammiferi, le aree deputate a questi 
sensi differiscono enormemente per dimensione e forma. 
Eppure, l’auto-organizzazione dinamica del cervello, come 
fa notare Krubitzer, è tale che «si può predire con un certo 
grado di certezza quali caratteristiche verranno 
probabilmente trattenute, quali tipi di modificazioni 
probabilmente interverranno e quali no» (p. 416). 


Se assumessi la posizione secondo cui i cambiamenti 
radicali hanno avuto origine nel cervello sulla base di una 
mutazione casuale e solo successivamente hanno avuto un 
impatto sugli altri organi, saremmo obbligati a sostenere 
che la talpa dal muso stellato ha sviluppato prima (senza 
una ragione particolare) una certa capacita di elaborare 
una grande varieta di odori e solo in seguito il proprio 
senso dell’olfatto; allo stesso modo, saremmo obbligati a 
sostenere che il pipistrello fantasma ha sviluppato la 
capacità mentale richiesta per l’ecolocazione e che la 
capacità di produrre i suoni richiesti sia invece emersa solo 
in seguito; e saremmo obbligati a sostenere che 
l’ornitorinco ha acquisito la capacità di processare i segnali 
elettrici presenti nell'ambiente prima di sviluppare gli 
elettrorecettori sul proprio muso e prima di avventurarsi 
nelle acque torbide. Pochi biologi (per non dire nessuno) 
accetterebbero queste tesi. La maggior parte, se non tutti, 
assumerebbe come ovvio che i nuovi organi di senso 
abbiano cominciato a emergere prima, in risposta a 
cambiamenti forzati o volontari nel comportamento o 
nell’habitat, e che il cervello abbia dovuto sforzarsi di 
rimanere al passo, riassestandosi per poter elaborare i 
nuovi tipi di informazione provenienti dall'esterno. 

In altre parole, un'assunzione generale sarebbe che, 
quando diventa disponibile una nuova fonte di 
informazione, i cervelli inevitabilmente redistribuiscono le 
proprie risorse - un processo che difficilmente può essere 
portato a termine nel volgere di una notte. Questi 
cambiamenti non hanno bisogno di essere innescati dalla 
selezione naturale, sebbene con ogni probabilità possano 
avere come risultato una migliorata capacità riproduttiva in 
quegli individui che li subiscono. Potrebbero essere 
motivati semplicemente da esigenze proprie del cervello, 
come quella di accorciare le connessioni neurali per 
risparmiare tempo ed energia. Nel caso degli antenati degli 
esseri umani, la nuova informazione non fu dovuta 


all’emergere di un nuovo equipaggiamento sensoriale, ma 
all'acquisizione delle parole e dei significati a esse 
connessi. Un dualista potrebbe assumere che la natura 
«mentale» di questo nuovo input avrebbe dovuto essere 
trattata in modo diverso rispetto alla natura «fisica» degli 
input sensoriali. Questa distinzione probabilmente non 
aveva alcun significato per il cervello. Quest'ultimo traduce 
ogni genere di input nello stesso linguaggio: un linguaggio 
fatto di scariche elettrochimiche, della loro trasmissione, 
del loro incremento e della loro inibizione. 

Se nel cervello umano c’è un qualche tipo di Grammatica 
Universale innata, essa consiste solo delle strutture e dei 
processi racchiusi nell’architettura di quel tipo di cervello. 
Se vogliamo ricostruire l'evoluzione ulteriore del 
linguaggio - e in modo particolare quegli elementi centrali 
che rimangono stabili attraverso tutte le variazioni e tutti i 
cambiamenti -, ciò che dobbiamo prendere in esame sono 
le probabili reazioni che il cervello ha avuto al fatto di 
essere stato colonizzato dalle parole. Se esistono degli 
universali del linguaggio e della comunicazione, essi 
possono essere nati solo all’interno del cervello. 


5 
LA GRAMMATICA UNIVERSALE 


«La grammatica universale è morta» (Tomasello 2009, p. 
470). Così affermava in maniera risoluta un commentatore 
di Evans e Levinson (2009a), un articolo che molti hanno 
considerato la pietra tombale sugli universali innati, specie 
quelli linguistici. In ogni caso Tomasello si affretta a 
precisare che «non è l’idea degli universali del linguaggio a 
essere morta; piuttosto, è morta l’idea che ci sia un 
meccanismo di adattamento biologico dotato di uno 
specifico contenuto linguistico» (p. 471). I linguisti hanno 
cercato gli universali in tutti i posti sbagliati. «Invece di 
guardare all’interno del sistema di input e output ... o nella 
pragmatica dello scambio comunicativo, si sono concentrati 
sulla sintassi e la combinatoria, la parte meno determinata 
di tutto il sistema, come dimostra la tipologia linguistica» 
(Evans e Levinson 2009b, p. 477). 

Purtroppo, «la sintassi e la combinatoria» è dove il gioco 
si fa più duro. Senza di esse, non ci sarebbe linguaggio. Nel 
migliore dei casi, saremmo rimasti per sempre in uno 
stadio prelinguistico simile a quello dei nostri antenati 
descritti alla fine del capitolo 4. Se gli eventi successivi 
fossero davvero accaduti senza un qualche supporto 
biologico, saremmo di fronte a un genere di anomalia 
evolutiva abbastanza diverso. Saremmo stati la prima 
specie ad acquisire la propria principale capacità senza 
alcun adattamento biologico a supportarla. In altri termini, 
l'atteggiamento anti-universalista nei confronti del 
linguaggio, che sembra essersi accresciuto e diffuso negli 
ultimi anni, è semplicemente un atteggiamento anti- 
evolutivo. 


Nessuno nega che vi siano delle caratteristiche 
dell'apparato fonatorio umano che si sono adattate 
biologicamente per parlare, e il discorso parlato non è altro 
che uno dei canali di produzione del linguaggio. Se non ci 
fossero degli analoghi adattamenti per ciò che viene 
espresso tramite il discorso parlato, questo sarebbe un 
mistero che di sicuro disorienterebbe i biologi. Un 
adattamento specifico dovrebbe essere a buon diritto 
l'ipotesi nulla e l’onere della prova dovrebbe ricadere su 
quanti la vogliono mettere in discussione. Tuttavia, forse a 
causa dello spettro del dualismo, sembra che in questo caso 
vengano adottati due pesi e due misure. Per quanto sia 
difficile trovare, oggi, dei filosofi dualisti, delle assunzioni 
dualiste permangono e sono difficili da eradicare. Molti, 
forse inconsciamente, sembrano assumere una qualche 
differenza tra fenomeni «mentali» e fenomeni «fisici». 
L'apparato fonatorio è «fisico», ed è quindi un ambito di 
applicazione legittimo dell'adattamento biologico; mentre 
le aree e le connessioni neurali che contribuiscono alla 
strutturazione delle frasi sono «mentali», e vanno perciò in 
qualche modo al di là del dominio della biologia. In realtà, 
questi due insiemi di fenomeni appartengono a un'unica 
classe (chiamateli «fisici» o come preferite, non fa 
differenza) e rispondono allo stesso modo a fattori biologici. 

Evans e Levinson (2009a, 2009b) affrontano molte delle 
presunte sfide agli universali. Per questioni di spazio qui 
posso fare riferimento a una sola di queste: la costituenza. 
Si tratta comunque di una questione cruciale (forse la più 
cruciale), e quello che dicono su di essa è esemplificativo di 
tutto ciò che dicono nel resto dei loro due articoli. 


LA STRUTTURA COSTITUENTE E LE SUE IMPLICAZIONI 


Le tesi più importanti della grammatica generativa si 
basano sull’idea che il linguaggio si formi su una base 


universale di costituenza. I costituenti che appartengono al 
medesimo sintagma devono far parte di una struttura 
contigua: 


1. [A [friend [of [Bill’s mother]]]] came here 
yesterday. 

2. *[A friend] came here [of Bill’s] yesterday 
[mother].? 


Come indica l’asterisco, (2) non è affatto grammaticale in 
inglese, come non lo sarebbe in qualsiasi altra lingua nella 
quale viga il principio della struttura dei costituenti nel suo 
senso più letterale. Allo stesso modo, mentre delle clausole 
subordinate possono apparire all’interno di frasi complesse 
in un ordine variabile, i costituenti delle diverse clausole 
non possono essere disposti a casaccio: 


3. [Sebbene fosse più piccolo], [il gatto [che ha 
mangiato il topo] ha attaccato il cane]. 

4. [Il cane è stato attaccato dal gatto [che ha 
mangiato il topo]], [sebbene questi fosse più 
piccolo]. 

5. [[Il gatto [che ha mangiato il topo], [sebbene 
fosse più piccolo]], ha attaccato il cane]. 

6. *[Il gatto ha attaccato [sebbene [che ha 
mangiato] fosse più piccolo] [il cane] [il topo]. 


In (3)-(5), delle intere clausole (per esempio, che ha 
mangiato il topo) possono essere inserite all’interno di altre 
clausole, ma solo se servono a modificare i nomi che 
compaiono in quelle clausole. Con questa eccezione, le 
clausole devono mantenere la propria integrità strutturale. 
Frasi come (6) non sono grammaticali in italiano, e 
nemmeno in molte altre lingue, probabilmente. 

Tuttavia Evans e Levinson (2009a, sezione 5) non parlano 
solo di una certa quantità di lingue con «un ordine libero 


delle parole» nelle quali delle frasi come (2) sono 
perfettamente grammaticali, ma sostengono anche che ce 
ne sia almeno una (lo jiwarli, una lingua australiana) nella 
quale vale la stessa cosa per frasi analoghe a (6), in cui i 
costituenti delle diverse clausole possono essere messi alla 
rinfusa. Questa evidenza, sostengono, distrugge la 
credibilita di qualsiasi teoria che assuma la costituenza 
come un universale linguistico. Qui di seguito assumerò che 
tutto questo sia corretto, nonostante i due autori non 
forniscano un esempio di una vera frase in jiwarli simile a 
(6), né facciano menzione specifica dei luoghi in cui andare 
a recuperare frasi di questo tipo - e nonostante il principale 
esperto di jiwarli parli di un ordine libero delle parole 
all’interno di una stessa clausola in un solo articolo che si 
occupa esplicitamente di ordine delle parole e declinazione 
dei casi in jiwarli (Austin 2001). 

Se la costituenza dovesse essere interpretata nel senso 
che tutti gli oggetti legati da una relazione di costituenza 
devono essere sempre fisicamente adiacenti l’uno all’altro, 
allora i fatti che Evans e Levinson adducono sarebbero 
davvero problematici per i generativisti. In verità la 
posizione standard dei generativisti è sempre stata che la 
costituenza sussista a un qualche livello della struttura, ma 
che dei processi successivi possono aver prodotto delle 
variazioni nell'ordine superficiale. Si noti che l'abbandono 
della distinzione originale fra struttura profonda e struttura 
superficiale (Chomsky 1957, 1965) da parte del Programma 
Minimalista (Chomsky 1995) non fa differenza fintanto che 
si assume, come si fa nel modello della bare syntax di 
Chomsky (1994), che le frasi siano derivate da una serie di 
operazioni di Merge che procedono dal basso verso l’alto. 
Nel corso della derivazione, si possono provocare delle 
modifiche all'ordine dei costituenti riapplicando il Merge a 
una copia del costituente che va mossa e poi cancellando 
l'originale (per esempio, se X deve essere «mosso», allora 
[X] + [YX] > [X [YX]] > [IX [Y - ]]). 


Se prendiamo la visione secondo cui la costituenza ha una 
base concettuale che non viene scalfita da considerazioni 
sugli aspetti superficiali, allora è la proposta di Evans e 
Levinson a diventare problematica. Levidenza più forte che 
adducono per la non-universalità della costituenza proviene 
dallo jiwarli, il quale, sostengono, può mescolare 
liberamente delle parole appartenenti a clausole diverse. 
Ma i due autori devono per forza ammettere che le parole 
mescolate sono «etichettate, per così dire, con istruzioni 
del tipo “sono l’oggetto del verbo della subordinata” oppure 
“sono il modificatore possessivo di un oggetto del verbo 
della principale”. Andando a ripescare questi casi distinti, 
un ascoltatore può riconoscere la struttura di una frase 
composta da due clausole ... senza dover prestare 
attenzione all'ordine in cui compaiono le parole» (Evans e 
Levinson 2009b, p. 441). Così dicendo, i due autori di fatto 
inficiano la propria tesi. Se il mescolamento dei costituenti 
non è tale che un destinatario non sia in grado di 
ricostruire in maniera corretta e completa la costituenza 
originaria del periodo, allora per quel destinatario la 
struttura costituente è reale quanto ogni altro aspetto del 
linguaggio. 

Curiosamente, mentre mostrano che in realtà molti degli 
universali già ritenuti tali in verità non lo sono, Evans e 
Levinson evitano di parlare di due universali che fanno 
parte della struttura di ogni frase in ogni lingua umana. 
Forse perché, a quanto ne so, nessuno ha mai sostenuto 
che si tratti di universali - il che deve suonare 
sorprendente per i non linguisti (come è stato per me 
quando me ne sono accorto per la prima volta). 
Probabilmente è proprio perché sono così in superficie, così 
evidenti e così dati per scontati, che i linguisti non hanno 
pensato a essi o non li hanno ritenuti degni di menzione. 
Eppure, tutte le frasi in tutte le lingue umane sono 
composte da sintagmi e clausole, e tutti i sintagmi e tutte le 
clausole sono costruiti essenzialmente allo stesso modo, 


hanno le stesse relazioni reciproche e si combinano negli 
stessi modi. Non è affatto ovvio che questo fosse 
inevitabile, e almeno un'opzione alternativa - un linguaggio 
fatto di soli sintagmi nominali - è stata proposta e difesa da 
Carstairs-McCarthy (1999). 

Quando abbiamo un meccanismo automatico per la 
creazione di sintagmi e clausole, gran parte del resto della 
sintassi segue logicamente o può essere inferito, e ciò che 
rimane può essere appreso sulla base dei buoni vecchi 
meccanismi di apprendimento generici. Alcune delle ultime 
sezioni di questo capitolo torneranno su questa questione, 
che sarà un tema importante che attraverserà i capitoli 
rimanenti - e in particolar modo il capitolo 6. 


L'«IMPOSSIBILITÀ» 
DELLA GRAMMATICA UNIVERSALE 


Alcuni studiosi non si limitano a negare l’esistenza degli 
universali linguistici: sostengono che sia logicamente 
impossibile che esistano degli universali linguistici. Il 
tentativo più completo di difendere questa tesi è quello di 
Christiansen e Chater (2008). La loro posizione di partenza 
è curiosa. Sebbene l’articolo si intitoli Language as shaped 
by the brain («Il linguaggio così come è stato forgiato dal 
cervello») - che è alla lettera il tema principale di questo 
capitolo -, quello che intendono dire è qualcosa di 
completamente diverso. La loro proposta è che «il 
linguaggio si è adattato attraverso un processo di 
evoluzione culturale perché fosse facile imparare a 
produrlo e a comprenderlo» (p. 490). 

Coloro che hanno commentato questo articolo (tra gli 
altri, Harnad 2008; Piattelli-Palmarini et al. 2008) hanno 
messo in luce alcuni problemi sollevati da questa 
formulazione. Ad esempio, per come è enunciata, essa si 
pone nei confronti delle proposte chomskiane ortodosse 
con un atteggiamento da «bicchiere mezzo pieno o mezzo 


vuoto» - il che va di certo contro le intenzioni degli autori, 
qualsiasi esse fossero; e compie indebitamente una vera e 
propria reificazione del linguaggio, trattandolo come un 
oggetto extraumano dotato di una identita propria e di 
obiettivi e intenzioni proprie. Una criticita ancora maggiore 
è che ne consegue logicamente che le versioni del 
linguaggio precedenti fossero più difficili da imparare a 
produrre e comprendere rispetto a quelle di oggi! Le forme 
di linguaggio più difficili da acquisire sarebbero dunque 
state quelle iniziali. Ma come avrebbe potuto essere così? A 
meno che non sia il dono di qualche benevolente divinità o 
la manifestazione di qualche ideale platonico, il linguaggio 
può provenire soltanto dal modo in cui funziona il cervello 
umano. Ma se è stato il cervello a produrlo, allora in che 
modo e per quale ragione esso avrebbe dovuto rendersi più 
semplice da elaborare per il cervello? 

Ignorando questi fatti misteriosi, Christiansen e Chater 
(2008) argomentano contro la possibilità degli universali 
linguistici, ma le loro argomentazioni si basano su delle 
assunzioni nascoste e alquanto improbabili: che gli 
universali abbiano cominciato a stabilirsi quando il 
linguaggio funzionava già a pieno regime e che il 
completamento di questo processo sia qualcosa di 
relativamente recente. 

Per esempio, sostengono che, poiché il cambiamento 
genetico è molto più lento di quello linguistico, la 
grammatica assorbita nel codice genetico sarebbe già 
obsoleta ancor prima di entrare in funzione. Questo parte 
dal presupposto che l’unica fonte degli universali linguistici 
sia antecedente alla produzione del linguaggio - che i 
parlanti abbiano prima dovuto usare certi tipi di strutture e 
che queste siano state codificate in seguito nel genoma per 
mezzo di un qualche tipo di «effetto Baldwin» (Baldwin 
1896). Se così fosse, avrebbero ragione, perché la 
produzione linguistica sarebbe davvero un bersaglio in 
movimento, e nessun’ processo genetico sarebbe 


abbastanza veloce per starle dietro. Ma questa 
argomentazione non è in grado di confutare la GU, neppure 
in linea di principio. Nel migliore dei casi, riuscirebbe 
semplicemente a mostrare che la GU non può essere il 
risultato dell’effetto Baldwin. In realtà, però, le cose sono 
anche peggio di così. 

L'idea stessa che la GU potrebbe essere prodotta da 
qualcosa di simile all'effetto Baldwin (e cioè incorporando 
nel genoma un comportamento non supportato 
geneticamente) è incoerente. Qualunque processo di 
questo tipo implicherebbe che le strutture linguistiche 
contenenti tutte le regolarità da includere nella futura GU 
esistessero prima della comparsa della stessa GU. Se 
queste strutture non sono venute dalla GU, da dove sono 
venute? L'unico posto da cui potevano venire era il cervello 
umano. Ma allora, che cosa farebbe la GU che i processi 
cerebrali non abbiano già fatto in precedenza? Perché 
esisterebbe la GU? O, per dirla più chiaramente: perché 
non chiamare GU qualsiasi cosa abbia reso possibile quei 
processi? Nel qual caso la GU sarebbe esistita prima delle 
strutture che si suppone l’abbiano originata. 

Anche le altre argomentazioni di Christiansen e Chater 
(2008) falliscono perché si basano su premesse errate. Per 
esempio, i due studiosi sostengono questo: poiché a partire 
dalla diaspora degli esseri umani dall’Africa, avvenuta tra i 
60.000 e i 90.000 anni fa, c’era stato relativamente poco 
contatto tra esseri umani in aree diverse, dovremmo 
aspettarci «più di una GU», o sue versioni diverse e in 
conflitto fra loro, le quali avrebbero prodotto tipi di 
strutture linguistiche incompatibili nelle lingue parlate in 
continenti diversi. Ma il fatto che queste versioni non ci 
siano dipende dall'assunzione non necessaria - e 
improbabile - che lo sviluppo della GU fosse incompleto al 
momento della diaspora. Se assumiamo che il linguaggio 
abbia una lunga storia protolinguistica e che (come 
suggerito dalla teoria della costruzione della nicchia) i 


cambiamenti significativi nel comportamento siano 
associati a degli eventi di speciazione, allora lo sviluppo 
della GU ha preceduto o accompagnato l’ultimo evento di 
questo tipo nella linea degli ominidi: l’evento che ha 
prodotto gli esseri umani anatomicamente moderni. In 
queste circostanze, una GU completa sarebbe esistita già 
decine di migliaia di anni prima della diaspora. 

Al pari di molti altri studiosi del campo di studi 
sull'evoluzione del linguaggio, Christiansen e Chater (2008) 
non prestano attenzione a ciò che il cervello deve aver 
cominciato a fare nel momento in cui furono inventate le 
parole. Gli unici ricercatori che si sono soffermati sugli 
sviluppi interni al cervello sono i generativisti (Piattelli- 
Palmarini 1989, 2010; Jenkins 2000; Chomsky 2010). Ma 
tra il loro approccio agli sviluppi interni al cervello e il mio 
ci sono delle profonde differenze, che ora vado a esporre. 


IL CERVELLO DÀ UNA MANO 


Prima di venire accusato di incoerenza, dal momento che 
non ho lesinato critiche agli approcci che sostengono che il 
linguaggio abbia avuto inizio da sviluppi interni al cervello, 
devo spiegare quali siano le differenze con il mio e 
dimostrare come non ci sia proprio nulla di incoerente 
nell'affermare che, mentre i processi che hanno condotto al 
linguaggio potrebbero essere iniziati con il comportamento, 
la GU avrebbe potuto provenire solo dal cervello. 

Secondo la teoria generativa, o il linguaggio e la GU sono 
emersi simultaneamente, senza alcun evento esterno che li 
abbia innescati, oppure la GU ha preceduto il linguaggio 
parlato come linguaggio del pensiero. Secondo la mia 
teoria, la GU e la comunicazione incrementata, che avrebbe 
portato al proto-linguaggio, sono emerse separatamente, in 
ordine inverso. In altre parole, il proto-linguaggio è 
scaturito a partire da fattori scatenanti esterni: la 


saprofagia conflittuale ha condotto al bisogno di reclutare, 
il quale a sua volta aveva bisogno di una comunicazione 
dislocata, la quale alla fine fu sufficiente, in animali sociali 
con cervelli di grandi dimensioni, per dare origine a un 
proto-linguaggio grezzo e privo di struttura - tutto cio di 
cui la natura aveva bisogno. Tuttavia questi processi hanno 
necessariamente fatto sì che nel cervello venissero 
archiviati degli oggetti simbolici; e gli unici processi interni 
al cervello che ci interesseranno sono quelli che, se da un 
lato possono aver sfruttato le risorse già in suo possesso, 
dall'altro sono stati innescati proprio dal bisogno che esso 
stesso aveva di trattare quel tipo di oggetti. 

Si noti che questa teoria è del tutto coerente con la teoria 
della costruzione della nicchia (Odling-Smee et al. 2003). Il 
processo di costruzione della nicchia può (o meno) essere 
accelerato da un cambiamento ambientale, ma implica 
sempre dei cambiamenti nel comportamento. Non sto 
affermando qui che questi cambiamenti siano stati 
implementati nel genoma, come invece vorrebbe 
l’interpretazione di Christiansen e Chater (2008) degli 
effetti Baldwin. Quello che accade è che i cambiamenti nel 
comportamento producono dei bias nelle pressioni selettive 
sugli organismi interessati, facendo sì che quelle pressioni 
favoriscano la selezione di qualsiasi variante genetica 
produca un comportamento che migliora lo sfruttamento 
della nuova nicchia. Nel nostro caso, un cambiamento nel 
comportamento messo in atto per cercare dei mezzi di 
sussistenza ha portato a un cambiamento nel 
comportamento legato alla comunicazione, il che ha 
causato un cambio significativo nelle pressioni selettive. 
Tali pressioni hanno influenzato l'architettura e il modo di 
funzionare del cervello, e i cambiamenti che ne sono 
scaturiti a livello delle strutture e delle connessioni 
cerebrali sono stati successivamente incorporati nel 
genoma. 


Le conseguenze di quella incorporazione si sono rivelate 
di una portata (forse) molto più vasta rispetto a ogni altro 
evento evolutivo dopo la comparsa dei primi organismi 
multicellulari. L'archiviazione di unità simboliche nel 
cervello ha reso possibile un cambiamento di diversi ordini 
di grandezza nei processi di pensiero; il resto è storia, in un 
senso abbastanza letterale. 


Dall'inizio del proto-linguaggio 


Con il proto-linguaggio la natura aveva già tutto ciò di cui 
avesse bisogno affinché una scimmia terrestre che 
praticava la saprofagia conflittuale potesse vivere e 
prosperare, anche in condizioni piuttosto estreme come 
quelle della savana. Se a questo punto non fosse 
intervenuto il cervello, probabilmente non sarebbe 
accaduto niente di più. Ci sarebbero state poche ragioni 
(per non dire nessuna) perché il linguaggio diventasse più 
complesso di come era. È improbabile che qualsiasi mossa 
in questa direzione avrebbe aumentato il potenziale 
riproduttivo degli individui interessati (Lightfoot 1991b; ma 
si veda anche Progovac 2009 per una prospettiva 
leggermente diversa su questo problema). Homo erectus 
avrebbe continuato a esistere senza cambiamenti 
sostanziali, dando origine infine - e forse solo in seguito a 
un cambio radicale delle condizioni ambientali - a specie 
discendenti senza capacità linguistiche sostanzialmente 
superiori e/o si sarebbe estinto. Non ci sarebbero misteri, 
anomalie e non sarebbe sorto il problema di Wallace. Ma 
nel cervello successero effettivamente alcune cose, 
altrimenti organismi come noi non sarebbero mai esistiti. 

In molti lavori sull'evoluzione umana, se non in tutti, i 
ricercatori provenienti da entrambi gli schieramenti 
coinvolti nella disputa tra innatisti ed empiristi partono dal 
presupposto che il cervello sia essenzialmente passivo. Sia 
per Christiansen e Chater (2008) sia per Chomsky (2010), i 


cambiamenti nel cervello sono degli eventi casuali. Per 
Christiansen e Chater essi non danno origine alla GU, 
mentre per Chomsky si; ma in nessuno dei due casi tali 
cambiamenti nel cervello sono in risposta diretta a 
cambiamenti provenienti dall'esterno, né i cervelli agiscono 
in un modo tale da suggerire che quei cambiamenti fossero 
in agenda. Ci sono invece delle buone ragioni per credere 
che i cambiamenti nel cervello non siano affatto casuali e 
che siano dettati da un’agenda specifica. 

Fin da principio, i cervelli hanno dovuto adattarsi a nuovi 
generi di input. Si sono adattati per migliaia di millenni per 
migliorare l'efficienza nell’elaborazione dei dati acquisiti 
tramite diverse modalità sensoriali, alcune delle quali non 
sono proprie degli esseri umani. Ora si trovavano a dover 
elaborare dei dati provenienti da una fonte di tipo diverso, 
che non si trovava fuori, ma dentro di loro. Questo 
coinvolgeva delle connessioni cortico-corticali prima non 
richieste, molte delle quali dovevano essere bidirezionali - 
così come un rafforzamento considerevole delle connessioni 
già esistenti tra parti del cervello relativamente distanti. 
Per esempio, un recente studio comparativo ha mostrato 
che il fascicolo arcuato, una delle principali vie neurali di 
collegamento tra la corteccia temporale laterale e la 
corteccia frontale e da tempo associata al linguaggio 
(Geschwind 1970; Catani e Mesulam 2008), è assai più 
sviluppato negli esseri umani che nei macachi o anche negli 
scimpanzé (Rilling et al. 2008). 

Non andrebbe mai sottovalutata la quantità di lavoro che 
questo ha comportato - per esempio, la semplice aggiunta 
di fibre efferenti a quelle afferenti e viceversa, poiché in 
molti casi i dati linguistici dovevano andare in due 
direzioni. Essa aiuta a render conto, tra le altre cose, della 
quantità di tempo che servì perché il proto-linguaggio 
diventasse linguaggio in senso vero e proprio. Ma la 
biologia ci offre delle buone ragioni per sostenere che la 


natura dei compiti richiesti sia del tutto alla portata della 
capacita auto-oganizzativa del cervello. 


Un modello dell’evoluzione della sintassi 
come dettata dal cervello 


La plasticità del cervello è cosa nota. In questa sede 
useremo questo termine non per indicare semplicemente la 
capacità del cervello di ricostruire le proprie funzioni in 
aree nuove (come spesso si fa nella letteratura neurologica: 
si vedano, per esempio, Robertson e Murre 1999; 
Johansson 2000), dopo che quelle originarie sono state 
compromesse da un trauma (per quanto questa abilità sia 
un corollario di ciò di cui sto parlando). Piuttosto, userò il 
termine nel suo senso un po’ meno tecnico, per indicare un 
grado di flessibilità e adattabilità, sia nella ontogenesi sia 
nella filogenesi, maggiore di quello che si trova negli altri 
organi. Ciò che sta alla base di questa plasticità e la rende 
possibile è una relazione che di rado viene discussa in 
letteratura: il rapporto tra la quantità di geni e la quantità 
di neuroni. 

In un organismo semplice come l’Aplysia, una lumaca di 
mare, il rapporto geni/neuroni è circa 2:1 (18.000-20. 
000/10.000). Negli esseri umani, il rapporto è nell’ordine di 
1:4 x 10° (30.000/100 miliardi; Venter et al. 2001). In altre 
parole, mentre la quantità di geni variò di poco in un range 
filetico ampio, una maggiore complessità determinò un 
incremento massiccio del numero di neuroni. In pratica, 
questo significa che, mentre nell’Aplysia i geni hanno il 
potere di determinare la posizione e la funzione di ogni 
neurone (proprio come determinano la posizione e la 
funzione degli arti in tutti gli organismi), quel potere era 
stato ben presto superato dalla proliferazione (soprattutto) 
dei neuroni corticali. Ne segue che dei fattori epigenetici, 
piuttosto che i geni stessi, hanno dato forma alla 
microstruttura, e a buona parte della macrostruttura, del 


cervello. Un fattore importante è stata l’economia nelle 
connessioni (Cherniak 1994, 2005). Per incrementare la 
propria efficienza, e allo stesso tempo diminuire l’esborso 
energetico, il cervello doveva ridurre al minimo 
indispensabile la lunghezza totale delle sue connessioni. 

Questo non vuol dire che lo sviluppo del cervello non 
ricada nell’ambito della selezione naturale, ma che, finché 
ci sono delle variazioni nel cervello (e ce ne sono sempre), 
l'evoluzione selezionerà ciò che lo rende più adatto in 
relazione ai suoi stessi bisogni, indipendentemente dal fatto 
che qualsiasi altra pressione selettiva che agisce sull'intero 
organismo vada (o meno) in quella stessa direzione. Per 
dirla in maniera più semplice: mentre (come ha suggerito 
Lightfoot 1991b) è improbabile che un principio linguistico 
comporti il fatto che Jack abbia delle relazioni sessuali più 
fruttuose, una migliore organizzazione del materiale 
linguistico e della sua elaborazione farebbe funzionare 
molto meglio il cervello di Jack, aumentando in questo 
modo il suo adattamento nel complesso. 

Che il cervello si auto-organizzi, da un punto di vista 
ontogenetico, è un fatto ben noto e consolidato (per 
esempio, Kandel et al. 2000, capitolo 55; Nazzi et al. 2001; 
FitzGerald et al. 2006). Quello che si è studiato meno è la 
modalità di sviluppo del cervello da un punto di vista 
filogenetico. Come si è detto nel capitolo 4, mentre 
l'architettura cerebrale dei mammiferi nel suo complesso si 
è fortemente conservata, le funzioni delle singole aree sono 
altamente variabili e la variazione è determinata in larga 
misura dal senso predominante (o i sensi predominanti) in 
ogni specie data (Krubitzer 1995). Perciò, quando gli organi 
dell’udito - poniamo - migliorano in portata e accuratezza, 
le aree del cervello deputate all'elaborazione dei suoni 
aumenteranno e si espanderanno, in alcuni casi prendendo 
il controllo di aree prima deputate ad altri sensi, in altri 
casi condividendo le funzioni legate all’udito con le 


preesistenti funzioni delle altre regioni (Krubitzer 1995; 
Manley e Clack 2004). 

Tuttavia, se i cervelli possono sviluppare delle diversita 
rimanendo nei confini di un’architettura comune, 
altrettanto facilmente possono raggiungere l’uniformità 
nella diversità. Per esempio, Kaschube et al. (2010) hanno 
studiato le colonne di orientamento (delle serie verticali di 
neuroni che rispondono in maniera preferenziale al 
medesimo orientamento) nella corteccia visiva di tre 
specie: il furetto, la tupaia e il galagone. Queste tre specie 
sono state separate fin dalla radiazione dei mammiferi 
avvenuta 65 milioni di anni fa e, di conseguenza, mostrano 
differenze nelle dimensioni, nella forma e nella posizione 
della corteccia visiva, nonché nella sua relazione con le 
altre aree specializzate. Eppure, allo stesso tempo, le 
colonne sono organizzate in modi quasi identici in tutte e 
tre le specie. Gli autori attribuiscono anche questo dato alla 
capacità che il cervello ha di auto-organizzarsi. Infatti, che 
il cervello mostri diversità nell’uniformità o uniformità nella 
diversità non sembra dipendere da un qualche genere di 
pressione esterna, ma solo dalla sua capacità di ottimizzare 
le proprie risorse. 

Di conseguenza possiamo assumere che, quando ha 
iniziato ad archiviare le parole, il cervello abbia subìto 
un’ampia riorganizzazione, le cui conseguenze si possono 
vedere facilmente nei moderni cervelli umani. Le parole 
non vengono archiviate a caso, ma classi di parole diverse 
sono archiviate in aree differenti; per esempio, esperimenti 
sul richiamo suggeriscono che i nomi siano archiviati nel 
lobo temporale, mentre i verbi nelle aree prefrontali 
(Caramazza e Hillis 1991; Damasio e Tranel 1993). Questa 
suddivisione riflette le differenze concettuali tra entità, da 
un lato, e azioni, stati ed eventi, dall’altro - e 
presumibilmente da esse deriva. Tuttavia ciò non significa 
che l'archiviazione sia confinata a queste aree. Piuttosto, le 
reti neurali che servono alla rappresentazione di una parola 


includono connessioni cortico-corticali sia a lunga sia a 
breve distanza (Pulvermuller 2001). Pertanto le reti che 
supportano i verbi come calciare o mordere includeranno i 
neuroni localizzati nelle aree motorie che controllano 
(rispettivamente) le gambe e la bocca (Pulvermuller 2008). 

Chi legge potrebbe obiettare che io stia mischiando 
filogenesi e ontogenesi. Di sicuro, mentre la ridistribuzione 
complessiva delle funzioni cerebrali può essere stata un 
processo filogenetico, l'instaurarsi di reti neurali può 
essere solo parte dell’ontogenesi. Questo è vero, 
naturalmente: è difficile credere che siamo nati conoscendo 
già le parole che siamo destinati a usare. Tuttavia, dal 
momento che le aree deputate ai verbi e quelle deputate al 
controllo delle gambe sono state stabilite su base 
filogenetica, e dal momento che il concetto di «calciare» è 
connesso a entrambe le proprietà, quando un bambino 
impara il termine calciare la sua rappresentazione gravita 
inevitabilmente intorno a quelle aree. Comunque la 
posizione precisa delle rappresentazioni individuali 
particolari nelle aree interessate varia da persona a 
persona in un modo che non si può predire (Ojemann 
1991). Questo segue logicamente dal fatto che, mentre nel 
loro complesso le aree per funzioni come «classe di parole» 
o «somiglianza di significato» sono stabilite su base 
filogenetica, le posizioni precise all’interno di quelle aree 
sono determinate dallo sviluppo del singolo bambino. (Un 
probabile fattore, in questo caso, è l’ordine variabile in cui 
le parole sono apprese). 

Il contributo decisivo degli sviluppi del cervello al 
linguaggio non è però contenuto nella sfera della 
parcellizzazione lessicale, quanto piuttosto in quella del 
perfezionamento e dell'automazione della costruzione di 
proposizioni dotate di significato. 


DALLA STRINGA ALLA FRASE 


Uno dei risultati interessanti dei tentativi di insegnare il 
linguaggio alle scimmie è che in tutte le specie studiate - 
scimpanzé (Gardner e Gardner 1969; Rumbaugh e Gill 
1976; Terrace 1979), gorilla (Patterson 1978), orango 
(Miles 1994) e bonobo (Savage-Rumbaugh e Fields 2000) - 
i soggetti degli esperimenti hanno prodotto dei 
proferimenti proposizionali costituiti da due o tre unità. 
Sulla base della letteratura, il collegamento tra oggetti 
lessicali usati per formare tali proferimenti non è mai stato 
cercato esplicitamente nell’addestramento; e, sebbene 
modellato giocoforza in un senso (difficilmente gli 
sperimentatori avrebbero potuto evitare di usare le 
proposizioni nell’addestramento), esso non è stato 
modellato come parte integrale dell’addestramento, né è 
stato in alcun modo sistematicamente rinforzato. In altri 
termini, questi proferimenti sembrano essere stati 
spontanei. Probabilmente, in alcuni casi erano delle 
imitazioni dei proferimenti prodotti in precedenza dagli 
sperimentatori, ma in molti altri no, poiché le parole 
seguivano un ordine che gli sperimentatori (come suggerito 
da Terrace et al. 1979), non avrebbero mai seguito. Questo 
mostra che la capacità potenziale di concatenare delle 
unità dotate di significato deve essere stata latente, non 
semplicemente nell'ultimo antenato comune a esseri umani 
e scimpanzé, ma anche nell’ultimo antenato di tutti i 
pongidi. 

Ad ogni modo, una volta che venga usato qualcosa anche 
solo vagamente simile a una parola, entrano in gioco pure 
delle considerazioni di ordine meramente logico che 
impongono che vi siano delle concatenazioni di 
proferimenti. I segnali che fanno riferimento a oggetti 
dislocati sono diversi dalle altre forme di segnalazione (e 
assomigliano alle parole), in quanto connettono dei pezzi 
specifici di ambiente piuttosto che desideri, stati mentali o 
ingiunzioni che mirano a influenzare il comportamento. Sia 
le parole sia i segnali di questo tipo devono connettersi con 


altre unita simili, se devono fungere da trasmettitori di 
informazioni. 

Segnali di altro genere possono essere usati 
individualmente - anzi, sono più utili così che come unità 
simboliche isolate. Se voi e io fossimo dei cercopitechi e io 
vi dessi il segnale di allarme per la presenza di un lupo, 
sapreste che dovete correre ad arrampicarvi su un albero. 
Ma siamo umani, e se io vi dico solo «lupo», voi non potete 
avere idea di quello che vi voglio dire. Dal momento che 
non ci sono lupi nei paraggi, potrei stare iniziando a 
parlarvi (il che sarebbe abbastanza peculiare) della mia 
personale esperienza dei lupi, o potrei essere in procinto di 
darvi delle informazioni sui lupi, oppure potrei accingermi 
a citare un noto adagio essenzialista - per quanto, in questo 
caso, voi potreste domandarvi perché mai io abbia omesso 
l'articolo determinativo nella citazione «Il lupo perde il pelo 
ma non il vizio». 

Di conseguenza, lo sviluppo della semplice 
concatenazione nel proto-linguaggio non necessita di una 
spiegazione particolare. La cosa da spiegare è come le 
parole abbiano iniziato a essere concatenate in un modo 
speciale e soggetto a princìpi specifici per ogni lingua - 
detto altrimenti, come siano state create le frasi. 


Concatenare unità simboliche 


Stabilire delle posizioni nel cervello non era l’unico 
compito che le parole avevano obbligato i cervelli a 
intraprendere. Era come se coloro che possedevano quei 
cervelli volessero mettere insieme quelle parole, ma 
all’inizio potessero farlo solo ad hoc, in maniera non 
strutturata - la modalità propria del proto-linguaggio. Fare 
le cose in questo modo era uno spreco di energie, e il 
cervello assegna una priorità molto elevata al risparmio 
energetico. «Una caratteristica universale del 
comportamento umano è che dei compiti abituali possono 


esseri portati a termine con uno sforzo o un controllo 
cognitivo relativamente basso, mentre i modi nuovi di 
eseguire gli stessi compiti possono richiedere un alto sforzo 
a livello di controllo cognitivo» (Poldrack et al. 2005). Di 
conseguenza, i cervelli devono aver avuto di mira 
l'automazione del processo di produzione dei proferimenti. 
E l'automazione consiste nel fissare una routine 
stereotipata in modo da aumentare la rapidità con cui viene 
eseguita. 

Ma come si poteva fare tutto questo? Per quanto 
concerne il processo fondamentale di questa routine - 
collegare una singola coppia di unità simboliche - 
raramente si considera il fatto che il cervello ha due modi 
piuttosto diversi per farlo. I gruppi di neuroni che 
rappresentano le parole potrebbero attivarsi direttamente a 
vicenda, in modo che le rappresentazioni di due o più 
parole si connettano nel cervello prima di essere inviate 
come sequenza al canale di emissione (orale o manuale) dei 
proferimenti. In alternativa, la rappresentazione di 
ciascuna parola potrebbe essere richiamata separatamente 
e inviata individualmente a un canale di emissione del 
proferimento prima che la parola successiva venga 
richiamata e inviata seguendo una procedura simile. Nulla 
nella struttura delle sequenze risultanti direbbe a un 
destinatario quale dei due metodi sia stato usato. Tuttavia 
possiamo fare questa predizione: il primo metodo, che 
prevede un solo (per quanto più complesso) insieme di 
istruzioni per il canale di emissione, avrebbe come effetto 
una maggiore velocità nel parlare rispetto al secondo 
metodo. 

È chiaro che il linguaggio usa il primo metodo. 
Considerate di nuovo gli esempi tratti dall'inglese proposti 
nel poscritto al capitolo 2, che qui ripeto per comodità: 


7. Who do you want to meet? 
8. Who do you want Mary to meet? 


9. Who do you want to meet Mary? 


Nel parlato quotidiano, la sequenza want to può essere 
ridotta a wanna in (10): 


10. Who do you wanna meet? 


Ovviamente, la contrazione di want-to viene impedita in 
esempi come (8) nei quali want e to non sono contigui. Ma 
viene impedita anche in (9) in cui essi sono contigui. 
Perché? Perché in (9) who è stato spostato dalla posizione 
che Mary occupa in (8): 


11. Who do you want [who] to meet Mary? 


(Si metta a confronto questo con la domanda che esprime 
sorpresa o chiede una conferma You want who to meet 
Mary?). Supponete che il cervello stia selezionando e 
inviando agli organi dell’apparato fonatorio le parole una 
per una. In (7)-(9), la quarta parola sarebbe want. A meno 
che la frase non sia già stata pianificata, la parte del 
cervello che controlla direttamente gli organi dell'apparato 
fonatorio non avrebbe modo di sapere quale sarà la quinta 
parola. Potrebbe essere on («... on your team?», «... nella 
tua squadra?») o if («... if Mary can’t come?», «... se Maria 
non puo venire?») o for («... fora partner?», «... come 
partner?»). Se la parola successiva non è to, non può 
esserci la contrazione want-to. Ma la contrazione non può 
esserci neanche se la parola successiva è una copia non 
pronunciata della clausola subordinata che funge da 
soggetto. Il meccanismo computazionale del cervello deve 
già in qualche modo sapere che una clausola subordinata 
deve seguire la quarta parola e che il soggetto di quella 
clausola, essendo la cosa su cui verte la domanda, deve 
avere una copia non pronunciata tra want e to. Questo 


implica che l’intera frase deve essere gia stata costruita 
prima di essere pronunciata. 

Evidenze empiriche provengono dalle differenze nei 
tempi di proferimento tra le scimmie addestrate e gli esseri 
umani e tra i parlanti di pidgin e i parlanti di una lingua 
umana vera e propria (potrebbe certamente trattarsi della 
stessa persona in tempi diversi). Tipicamente, nel parlato 
delle scimmie ci sono dei lunghi intervalli tra i singoli 
elementi; quindi, per esempio, il tanto celebrato 
proferimento di Washoe bambino nella mia bevanda è 
durato tre secondi (Terrace et al. 1979, tavola 7), mentre la 
velocità normale per i proferimenti umani è di tre parole al 
secondo. Analogamente, nel pidgin allo stadio iniziale la 
velocità del parlato è di circa tre volte inferiore rispetto alla 
parlata creola dei discendenti dei parlanti di pidgin 
(Bickerton 2008; la rilevanza di tutto questo sarà chiara nel 
capitolo 8). 

Queste diverse velocità di proferimento sono senza 
dubbio il riflesso delle diverse forme di connettività 
neurale. (Non si vede di che altro dovrebbero esserlo). Una 
velocità bassa si ha o quando non c’è nessuna connessione 
percorribile tra rappresentazioni di parole oppure quando, 
qualunque sia la connessione, questa è così lunga e 
tortuosa che è più veloce ed efficiente pronunciare le 
parole in serie e individualmente che assemblarle prima di 
inviarle. Connessioni dirette e veloci tra rappresentazioni di 
parole nel cervello vengono formate sulla base di ripetute e 
simultanee attivazioni dei neuroni rilevanti (Hebb 2002; si 
veda anche Pulvermuller 1999; Garagnani et al. 2009 e i 
riferimenti citati). 

Ne segue dunque che i membri di molte popolazioni non 
possono avere delle connessioni dirette e veloci. Queste 
popolazioni includono le persone nelle primissime fasi di 
apprendimento della seconda lingua, i parlanti del pidgin 
allo stadio iniziale e gli antenati degli esseri umani all’inizio 
dell'evoluzione del linguaggio. In nessuno di questi casi i 


soggetti hanno avuto il tempo di accumulare la quantita di 
attivazioni simultanee richiesta prima che si formino le 
connessioni dirette. Negli antenati degli esseri umani 
questo stadio non è mai stato raggiunto. Nel pidgin può 
essere raggiunto in linea di principio, per quanto lo sia con 
frequenza relativamente rara. In coloro che stanno 
imparando una seconda lingua se venga raggiunto o meno 
dipende dal grado di esposizione a quella lingua e dalle 
motivazioni del singolo. 

Per dirla in altri termini, pronunciare parole è un 
processo autocatalitico: più si usano, più si diventa veloci, 
al punto da riuscire ad assemblarle mentalmente prima di 
proferirle. Questo è probabilmente ciò che sta alla base di 
un fenomeno che, pur essendo ben noto a livello di 
aneddotica, è poco studiato ed è conosciuto come «pensare 
in una lingua straniera» - uno stadio che in genere non si 
raggiunge prima di avere una moderata familiarità con il 
lessico della lingua in questione. Un controesempio a tutto 
questo potrebbe sembrare quello che potremmo chiamare 
«effetto Macaulay», dal nome del caso più famoso (il 
piccolo Lord Macaulay): si tratta di un altro fenomeno ben 
noto ma poco studiato in cui un bambino rimane muto fino 
a circa tre anni, per poi iniziare a usare sintagmi e clausole 
complete. Ma perché ciò accada, altri devono aver parlato e 
il bambino deve aver elaborato il loro linguaggio. Sembra 
che l’elaborazione passiva sia sufficiente per sviluppare 
attivazioni di rappresentazioni lessicali (Petersen et al. 
1990; Price et al. 1996), rendendo così possibile la 
formazione di connessioni dirette tra esse, il che a sua volta 
rende possibile dei proferimenti veloci. 

Connettere le parole per formare proposizioni fa due 
cose. La prima: dal momento che le parole devono essere 
connesse con i concetti a loro associati, il semplice atto di 
proferirle crea delle connessioni che uniscono tanto le 
parole quanto i concetti. Questo è precisamente ciò che 
rende possibile le successioni di pensieri volontarie e 


razionali che distinguono gli umani dai non-umani. La 
seconda: la congiunzione di coppie tipiche di parole - per 
esempio, «correre» e «albero», un verbo di movimento e il 
suo complemento direzionale - getta le basi per la sintassi, 
dando la priorità a certe coppie di parole e legandole più 
strettamente rispetto a quelle coppie a cui mancano 
connessioni semantiche o pragmatiche forti. Tali 
congiunzioni potrebbero essere servite come precursori del 
Merge, il processo che sta alla base della sintassi. 
(Ricordate, comunque, che un processo simile al Merge è 
implicito nel modo in cui il cervello gestisce la visione, 
combinando output di vari gruppi di cellule per creare 
un'immagine apparentemente continua). 


Strutturare le concatenazioni 


Nel proto-linguaggio potrebbe non esserci stato alcun 
vincolo formale su quali parole potessero connettersi l’una 
all'altra. È anche probabile che i proferimenti proto- 
linguistici facessero un uso frequente della ripetizione. 
Questo è comune negli esperimenti sul linguaggio delle 
scimmie: ad esempio, l’episodio in cui Panbanisha «ha 
ripetutamente premuto tre simboli in varie combinazioni - 
“combattere”, “pazzo”, “Austin”’» per riferire un 
combattimento avvenuto tra altre due scimmie (Johnson 
1995); oppure prendete il proferimento di Tim, il più lungo 
mai registrato in una scimmia: «Dare arancia me dare 
mangiare arancia me mangiare arancia dare me mangiare 
arancia dare me tu» (Terrace 1979, p. 210). In questo 
spirito, McDaniel (2005, p. 162) ipotizza che bambino 
albero leopardo bambino bambino uccidere potrebbe 
essere un proferimento proto-linguistico di chi osserva un 
leopardo in procinto di balzare da un albero su un piccolo 
che si trova sotto. Come avvertimento potrebbe funzionare, 
ma per le esigenze della comunicazione quotidiana 
andrebbe un po’ sfoltito. Data la ripetizione e l'assenza di 


sintassi, l'ambiguità dei proferimenti aumenta 
velocemente. Sarebbe difficile, forse a volte impossibile, 
determinare chi abbia fatto che cosa a chi. 

In ogni genere di lingua, non appena si va oltre gli 
avvertimenti e i comandi diventa essenziale per la 
comprensione determinare chi abbia fatto che cosa a chi. 
Ma, senza la sintassi, si dipende da indizi di natura 
pragmatica o semantica, i quali possono essere pochi o 
assenti, oppure, quando presenti, confusi. Non 
sorprenderebbe se i proferimenti proto-linguistici avessero 
avuto le regolarità grezze nell’ordine delle parole che si 
sono riscontrate nei pidgin (Givén 1979), dove è tipico che 
il tema e le informazioni vecchie precedano il rema e le 
informazioni nuove. Tali regolarità complessive sono state 
riscontrate nei proferimenti delle scimmie (si veda Savage- 
Rumbaugh e Rumbaugh 1993 per una revisione critica), 
naturalmente con molte eccezioni. Questo fattore può aver 
aiutato la comprensione, ma potrebbe essere stato utile 
solo nel caso dei proferimenti corrispondenti (grossomodo) 
a frasi composte da una sola clausola. Qualunque frase più 
lunga richiederebbe una struttura stereotipata, ripetibile e 
automatica perché ne sia garantita una comprensione 
accurata. 

Fino a che punto è realistico supporre che un cervello, il 
cui solo obiettivo fosse quello di massimizzare la propria 
efficienza nell’elaborazione, abbia fornito la struttura per 
rendere più efficiente il linguaggio dei preumani? Hurford 
(2003, 2007b) ci dà un suggerimento interessante: molti 
organismi non umani hanno in comune con quelli umani 
due vie cerebrali, quella dorsale e quella ventrale, che 
determinano rispettivamente la posizione e l’identità degli 
oggetti; Hurford vede in tutto questo la base della 
predicazione - la quale a sua volta è la base della sintassi. 
Tuttavia «l'origine delle nozioni di soggetto e predicato è la 
logica e non la grammatica» (Jones 1956, p. 184) e le 
strutture che prevedono più di un partecipante (soggetto, 


oggetto diretto e indiretto, ecc.) sono di gran lunga la 
tipologia di clausole più frequente. Se si volesse assumere 
un approccio gradualista, si potrebbe suggerire che il 
cervello abbia cominciato con delle predicazioni semplici 
come i leoni (sono) pericolosi, per poi elaborare strutture 
più complesse come sembra che i leoni attorno a quel 
deinoterio abbiano già mangiato i pezzi migliori. Tuttavia 
non pare esserci ragione per cui, dati nomi e verbi, il 
cervello non abbia messo a punto un meccanismo 
sistematico per generare automaticamente frasi senza 
bisogno di basarsi su qualche precursore più semplice, 
anche se (come probabilmente è accaduto) i prodotti 
iniziali di quel meccanismo tendevano a essere meno 
lunghi. 

Fino all'avvento delle tecniche di brain-scanning (per un 
resoconto storico recente, si veda Gulyas 2010), era 
possibile credere che il linguaggio fosse mediato da uno o 
due moduli altamente specializzati. Le prime ricerche 
sull’afasia sembravano suggerire dei luoghi specifici, le 
aree di Broca e di Wernicke, con la prima che si supponeva 
gestisse gli aspetti sintattici del linguaggio e la seconda 
quelli semantici. I risultati di PET e fMRI hanno però 
mostrato che, se ci fosse qualcosa di simile a un «organo 
del linguaggio», sarebbe molto più simile a una «ameba del 
linguaggio» (Szathmary 2001), una rete di connessioni tra 
molte aree diverse, comprese le regioni extra-corticali. 
Infatti la rete deputata specificamente alla sintassi aveva 
più o meno la stessa estensione: «Le aree focali della rete 
(l’area di Broca, l’area di Wernicke, il cervelletto, la CPD 
[corteccia prefrontale dorsale], la CCA [corteccia cingolata 
anteriore]) sono connesse in maniera molto forte» (Dogil et 
al. 2002, p. 85). Nessuna delle aree in questione è deputata 
esclusivamente alla sintassi, e ciascuna è incorporata 
all’interno di altre reti con funzioni diverse; risulta perciò 
difficile distinguere esattamente quale contributo sia 


fornito all’elaborazione sintattica da ciascuna delle aree 
interessate. 

Il lavoro di Friederici e dei suoi colleghi (Grodzinsky e 
Friederici 2006; Friederici 2010) ha proposto due strutture 
distinte, una che si occupa della struttura sintagmatica 
locale e l’altra delle frasi più complesse. Molti studi 
condotti utilizzando l’imaging si concentrano tuttavia più 
sulla comprensione che sulla produzione; e mentre la 
comprensione può chiamare in causa altri aspetti del 
linguaggio oltre alla sintassi, la produzione richiede 
invariabilmente l’impiego di processi sintattici. Non 
sorprende che quasi tutto ciò che sappiamo 
sull’elaborazione sintattica da parte del cervello sia vago o 
controverso, come non sorprende che un intero consorzio 
di specialisti in questo campo si sia trovato d’accordo 
nell'affermare che «per comprendere la neurobiologia della 
sintassi, potrebbe essere utile ricalibrare il peso dato alla 
comprensione della codificazione sintattica nella 
produzione del linguaggio» (Fedor et al. 2010, p. 309). A 
tutto questo gli studiosi di sintassi possono solo aggiungere 
un appassionato e sentito «Amen!». 


UN MODELLO ASTRATTO 
DI COME IL CERVELLO GESTISCE LA SINTASSI 


In che modo un cervello avrebbe potuto affrontare il 
compito di approntare una formula per la costruzione delle 
frasi? Tanto per cominciare, tutto ciò che il cervello 
possedeva era una piccola quantità di cose che aveva già 
distinto in classi separate: una era la classe che denotava le 
entità (che sarebbe diventata la classe dei nomi) e l’altra 
era quella che denotava azioni, stati ed eventi (che sarebbe 
diventata la classe dei verbi). Dal punto di vista della 
natura, non era obbligatorio che le cose andassero così. 
Carstairs-McCarthy (1999) ha immaginato uno stato di cose 
senza i verbi, in modo che il linguaggio, invece che da frasi, 


sarebbe stato costituito interamente da sintagmi nominali 
espansi. E ha mostrato che un tale linguaggio non avrebbe 
necessariamente avuto meno potere espressivo del 
linguaggio che conosciamo. 

Quello che sembra naturale è che, data l’esistenza di due 
classi, ciascuna dovesse diventare la base per strutture di 
dimensioni sempre più grandi - se c'erano nomi e verbi, 
dovevano in definitiva esserci anche delle unità più grandi 
formate aggiungendo altre parole (rispettivamente) ai nomi 
e ai verbi. Dopotutto, quasi ogni parola ha bisogno di 
essere accompagnata da una o più parole, se si vuole 
esprimere qualcosa che non abbia un contenuto assai 
generale. 

Tradizionalmente, queste unità più grandi vengono 
descritte come «sintagmi nominali» e «sintagmi verbali». Il 
significato di queste espressioni, tuttavia, rischia 
francamente di produrre solo confusione nell'esposizione 
che seguirà. In primo luogo, è assunzione comune 
(Chomsky 1957) che i «sintagmi nominali» e i «sintagmi 
verbali» siano elementi complementari, separati e distinti, 
delle proposizioni. In secondo luogo, il loro significato ha 
subìto cambiamenti significativi negli ultimi decenni. Ciò 
che all’inizio veniva chiamato sintagma nominale viene oggi 
spesso chiamato «sintagma determinante», nel quale un 
determinante (i determinanti sono gli articoli, gli aggettivi 
dimostrativi come «quello» e cose simili) prende come 
proprio complemento un sintagma nominale (Abney 1987). 
In precedenza, i soggetti delle frasi venivano esclusi da 
un'espressione nominale, ma in seguito vi sono stati 
compresi (Koopman e Sportiche 1985). Di conseguenza, 
abbandonerò le espressioni sintagma nominale e sintagma 
verbale e farò riferimento a un nome e a tutti i suoi 
modificatori semplicemente con «sintagma» (nessun altro 
genere di espressione verrà discusso né assunto), mentre 
userò «clausola» per riferirmi a un verbo e ai suoi 
modificatori (i quali naturalmente includono tutti i suoi 


argomenti - i partecipanti all’azione espressa dal verbo - 
siano essi «interni» o «esterni», obbligatori o opzionali, 
compresi soggetto, avverbi e simili), a meno che non stia 
riportando l’uso che altri fanno di questi termini. 

La necessità di espandere le espressioni nel caso dei nomi 
è dovuta al fatto che un nome, di per sé, non può 
specificare un individuo (salvo, naturalmente, che si tratti 
di un nome proprio), ma solo il concetto relativo a una 
certa classe di entità. I modificatori si sono resi necessari 
non appena il proto-linguaggio si è separato dal qui-e-ora - 
cioè quando il contesto immediato insieme alle 
considerazioni pragmatiche non erano più sufficienti per 
identificare i referenti specifici: quel cane, il cane marrone, 
il cane che scodinzola, il cane di cui ti parlavo ieri. I 
modificatori si sono potuti sviluppare in lunghezza e 
complessità man mano che il sistema cresceva, poiché non 
veniva specificato in maniera precisa che cosa potesse 
essere un modificatore o (al di là di considerazioni di 
natura puramente pratica) quanto potesse essere lunga la 
stringa dei modificatori. 

Anche i verbi avevano bisogno di modificatori. Nominare 
una classe di azioni, stati o eventi non ci dice pressoché 
niente. Dobbiamo sapere quali partecipanti sono stati 
coinvolti in quell'evento, chi o che cosa ha esperito quello 
stato, chi ha compiuto l’azione e chi o cosa l’ha subita. Per 
specificare un certo episodio, non dobbiamo conoscere solo 
il verbo ma anche i suoi partecipantichiave che il verbo 
specifica - nella maggior parte dei casi, essi vanno da uno a 
tre (e corrispondono a quelli che in grammatica sono 
chiamati «argomenti sottocategorizzati» del verbo). A 
questo punto intervengono almeno due fattori preesistenti: 
la memoria episodica e l’altruismo reciproco. 

All’inizio si riteneva che la memoria episodica fosse 
prerogativa degli esseri umani (Tulving 1984). Tuttavia, in 
questo secolo, ha trovato sempre più supporto la tesi che 
esista una memoria episodica non umana, sia per ragioni 


teoriche (Dere et al. 2006; Griffiths et al. 1999) sia per 
ragioni empiriche. Per quanto riguarda queste ultime, é 
stata dimostrata la presenza di quella che, con una certa 
cautela, viene chiamata «memoria episodica» nelle 
ghiandaie americane (Clayton et al. 2001), nei topi (Eacott 
et al. 2005) e nei colibrì (Henderson et al. 2006), tra gli 
altri. La memoria episodica potrebbe fornire quella 
consapevolezza della struttura di un evento («chi ha fatto 
che cosa a chi») che è una delle basi essenziali della 
struttura sintattica. 

Che facesse questo in almeno alcune altre specie prive di 
linguaggio è suggerito dalla teoria dell’altruismo reciproco 
(Trivers 1971): «Ti gratto la schiena, se tu gratti la mia». 
La teoria dei giochi (Maynard Smith 1982) implica che, 
perché la reciprocità diventi una strategia evolutiva stabile, 
ci debba essere qualche meccanismo per smascherare chi 
imbroglia (Barkow et al. 1992). Naturalmente, un tale 
meccanismo è disponibile se la memoria episodica fornisce 
effettivamente la struttura dell'evento. Alcuni biologi 
rimangono scettici su questo punto (Hauser et al. 2009), 
ma c’è una quantità di evidenze impressionante a supporto 
della reciprocità nel grooming, da Seyfarth e Cheney 
(1984) a Schino e Aureli (2008). Questi ultimi hanno 
sondato la reciprocità nel grooming in ventuno specie di 
primati e hanno riscontrato che in ognuna di esse «le 
femmine preferiscono fare grooming con quei gruppi di 
compagni che fanno più grooming con loro» (Hauser et al. 
2009 non trattano questi casi considerandoli suscettibili di 
una spiegazione più economica, sebbene non dicano in che 
senso). 

Le preferenze nel grooming tra primati in generale sono 
quindi, con ogni probabilità, guidate dalla memoria 
episodica sia di «quante volte tu hai fatto grooming a me 
rispetto a quante volte l’ho fatto io a te», sia di «quante 
volte X ha fatto grooming a me rispetto a quante volte l’ha 
fatto Y». Ciò basta per avere la struttura dell'evento «chi 


ha fatto che cosa a chi», la quale a sua volta fornisce la 
struttura di base delle clausole (Bickerton 2000). 

Laggiunta di modificatori alle teste del verbo avrebbe 
dunque richiesto la produzione delle operazioni di 
costruzione dei sintagmi nominali già descritte. La 
semantica di ciascun verbo sarebbe allora determinata, che 
esso richieda uno (Maria è partita), due (Maria ha 
incontrato Giovanni) o tre sintagmi (Maria ha dato un libro 
a Giovanni). Inoltre, si possono aggiungere degli oggetti 
opzionali; anche coloro che sono scettici in merito al fatto 
che vi sia una vera e propria memoria episodica nei non- 
umani difficilmente mettono in discussione che, in molti 
animali, una memoria «simil-episodica» fornisca il 
«quando» e il «dove». 

Ma la domanda cruciale è la seguente: dati questi 
materiali, in che modo il cervello ha prodotto la sintassi a 
partire dai proferimenti casuali e guidati dalla pragmatica 
propri del proto-linguaggio? Una risposta plausibile emerge 
quando consideriamo come il cervello gestisce le azioni 
motorie routinarie come il lancio mirato. 

Devo essere cauto qui, perché quanto sto dicendo 
potrebbe essere mal interpretato in due modi. Potrebbe 
essere preso come qualcosa a supporto delle idee espresse 
nei lavori di Lieberman (1984, 2010) e Allott (1992), i quali 
assumono che i sistemi motòri siano alla base dei 
meccanismi linguistici e siano stati direttamente 
responsabili della loro evoluzione. Oppure (specialmente a 
fronte del fatto che ho proposto il caso paradigmatico del 
lancio) potrebbe essere preso come qualcosa a supporto 
delle proposte di Calvin (1982; Calvin e Bickerton 2000), 
secondo cui le facoltà cognitive umane sono in larga parte 
derivate dal lancio mirato e secondo cui una frase è in 
qualche modo strutturata come un lancio. Credo che questi 
approcci siano troppo semplicistici; ma c’è un senso più 
generale in cui la strutturazione di una frase è analoga alla 
strutturazione di un’azione motoria stereotipata. Per 


ottenere il massimo risultato, entrambe devono seguire uno 
schema (Arbib 2003), un programma predeterminato, che 
(tra le altre cose) detti la sequenza secondo la quale vanno 
eseguite le parti che compongono le azioni. Per esempio, la 
finestra di tempo per dare il via a un lancio é solo di pochi 
millisecondi, ma deve essere programmata per coincidere 
con il punto pit alto dell’arco formato dal braccio che 
esegue il lancio. 

La strutturazione e l’automazione delle azioni motorie 
devono avere una prospettiva sia filogenetica sia 
ontogenetica. Non può essere che i piccoli di scimpanzé e i 
bambini umani partano dallo stesso livello di capacità nel 
lanciare; perciò deve far parte del genoma umano un 
qualche tipo di schema per il lancio (naturalmente da 
affinare poi con l’esperienza). I cervelli degli antenati degli 
esseri umani devono aver cominciato dal livello di abilità di 
uno scimpanzé. Essi hanno potuto poi svilupparsi a partire 
da quel livello solo se il lancio mirato ha aumentato 
l'adattamento degli esseri umani, venendo utilizzato per la 
saprofagia conflittuale, per la caccia opportunista o per 
combattere all’interno del gruppo. Ciò che sto proponendo 
qui è solo questo: una volta che i nostri progenitori abbiano 
incominciato a parlare, anche soltanto a livello di pre- 
linguaggio, il loro cervello avrebbe iniziato a elaborare 
degli schemi per rendere la produzione di frasi 
un'operazione routinaria (se preferite, chiamate questi 
schemi algoritmi per la produzione di frasi), proprio come 
aveva elaborato degli schemi per il lancio mirato e per altre 
azioni simili. La stereotipizzazione e l'automazione degli 
schemi per l’azione permette di risparmiare energia e 
libera dei neuroni per altre funzioni. 

Qualcuno troverà più semplice credere possibili schemi 
per l’azione fisica che per quelle che si potrebbero 
considerare «azioni mentali». Questo è un altro riflesso di 
un dualismo di cui fatichiamo a liberarci. Sia che si 
considerino azioni fisiche come quella di lanciare, azioni 


«mentali» come quella di ragionare o cose che sembrano 
essere dei composti di fisico e mentale come creare e 
proferire delle frasi, stiamo parlando di eventi innescati 
esattamente dalle medesime operazioni: dei gruppi di 
neuroni attivano altri gruppi di neuroni. È noto da diverso 
tempo che i neuroni che si attivano quando viene eseguita 
un'azione sono gli stessi che si attivano quando si sta 
semplicemente pensando all'esecuzione di quell’azione 
(Decety et al. 1991, 1994; Paus et al. 1993; Jeannerod 
1997). In altre parole, dal punto di vista del cervello i 
pensieri non sono altro che delle azioni di cui esso non 
parla al corpo. Comunque dovremmo essere cauti 
nell'affermare, a partire da qui, che «i pensieri non siano 
nient'altro che frasi che il cervello non trasforma in 
proferimenti». Un pensiero non possiederà tutto 
l’armamentario che è proprio delle frasi del linguaggio 
moderno - le flessioni, le parole-funzione, gli elementi 
fonologici. Ma i mezzi per connettere i concetti che 
vengono manipolati dal pensiero saranno gli stessi usati 
per connettere le parole nei sintagmi e nelle clausole di cui 
fa uso il linguaggio. La sintassi del pensiero avrà lo stesso 
scheletro della GU che si sta descrivendo qui. 

Per riassumere, l'assunzione minima che possiamo fare è 
questa: il cervello di un primate, una volta che abbia a 
disposizione le parole, arriverà alla fine a creare degli 
algoritmi per la costruzione di sintagmi (prendere un nome 
e aggiungere un modificatore) e clausole (prendere un 
verbo e aggiungere un sintagma). Si noti che, oltre a molto 
altro, questi algoritmi implicano la produttività infinita che, 
fin da Chomsky (1965), è stata sempre riconosciuta come 
un elemento di base ed essenziale del linguaggio. Si noti 
anche che tale produttività è dovuta alle proprietà del 
sintagma almeno quanto a quelle della clausola. Una 
clausola contiene in sé un limite. Essa può includere solo 
tanti partecipanti quanti sono quelli per cui il cervello è in 
grado di distinguere una funzione specifica (per esempio, le 


entita con ruoli tematici): Attore, Tema (cid che subisce 
direttamente l’azione espressa dal verbo) e Destinatario 
sono - oltre a Tempo, Luogo e altre una o due - le tre 
funzioni-chiave individuate dai meccanismi di memoria 
episodica/altruismo reciproco. Tuttavia non c’é limite né al 
genere né al numero dei modificatori che puo avere un 
nome, clausole incluse (il cane nero con le macchie bianche 
che hai visto ieri). (Naturalmente, anche i verbi possono 
avere come propri modificatori delle clausole subordinate, 
se queste soddisfano una delle funzioni richieste dal verbo, 
per esempio quella del Tema, nel caso di verbi che reggono 
complementi fattivi: mi hai detto che sei venuto ieri). In 
linea di principio, le frasi sono infinite, dal momento che un 
verbo che regge complementi fattivi può selezionare una 
clausola con un verbo simile come propria testa (Giovanni 
pensava che a Maria sembrasse che Guglielmo credeva...) e 
un nome all’interno di una clausola modificatrice può 
essere esso stesso modificato (c’è il gatto che ha ucciso il 
topo che mangiò il malto che era in casa...). 

Tutto quello che resta da mostrare è come questi 
algoritmi possano funzionare nella pratica per produrre il 
genere di fenomeni linguistici che vengono descritti dagli 
studiosi di sintassi. 


IL PROCESSO DI COSTRUZIONE DELLE FRASI 


Sebbene il minimalismo chomskiano non sia mai stato 
considerato un modello del modo in cui il cervello 
costruisce le frasi, come abbiamo visto nel capitolo 2, esso 
rimane comunque un buon inizio per comprendere il 
funzionamento di questo meccanismo. 

Indipendentemente dalle vostre assunzioni teoriche, il 
cervello deve sempre cominciare a costruire la frase 
partendo da un qualche equivalente di ciò che Chomsky 
(1995, p. 225) chiama «numerazione», la procedura che 


raccoglie tutti gli oggetti lessicali da usare in una frase (in 
termini neurali, l'attivazione simultanea dei neuroni nelle 
aree in cui sono archiviate le parole da usare). A questo 
segue l'operazione chiamata «Seleziona», la quale comincia 
dalla scelta dei primi oggetti, tra quelli enumerati, a cui 
applicare il Merge. 

Come vengono scelti gli elementi per la numerazione? Il 
fenomeno universale e ben noto del «priming lessicale» 
(Bock 1986) suggerisce che, nel mondo reale, il cervello 
possa non essere in grado di richiamare un oggetto 
lessicale senza innescarne altri, alcuni dei quali non 
rilevanti per la frase in questione. Può darsi che il cervello 
obbedisca a un qualche genere di «darwinismo neurale» 
(Edelman 1987) tale che, come suggerisce Calvin (1996), ci 
possono essere diverse «frasi candidate» che si formano 
simultaneamente ed entrano in competizione per essere 
inviate agli organi dell'apparato fonatorio. Questo è 
compatibile con errori di sostituzione nel parlato dovuti a 
somiglianze nei suoni senza che vi siano somiglianze 
semantiche (fire per flour, slips per sleeps, clam per climb); 
è compatibile con errori di sostituzione dovuti a relazioni 
semantiche senza che vi siano somiglianze fonologiche 
(rango invece di lavoro, prossimo invece di ultimo, scienza 
invece di medicina); ed è anche compatibile con dei 
miscugli come swishle, una combinazione delle parole 
inglesi swish (fruscio) e sizzle (sfrigolio), nei quali vi sono 
somiglianze sia fonologiche sia semantiche (i dati sono 
presi da Garnham et al. 1981). In termini di darwinismo 
neurale è plausibile l’idea che ci sia una selezione multipla 
seguita da un qualche tipo di potatura - cioè che la 
selezione iniziale avvenga in maniera casuale e vengano poi 
scelti solo quegli oggetti le cui caratteristiche si 
corrispondono a vicenda. 

Segue poi l'operazione che Chomsky ha descritto come 
Merge. Per Chomsky (2000), la procedura «fare Merge di A 
con B» è un'operazione simmetrica. Abbiamo conseguenze 


diverse, e io penso preferibili, se guardiamo a questa 
operazione come asimmetrica, ridefinendola come «Attacca 
A a B», dove A è un modificatore e B una testa (o una 
struttura che già incorpora una testa e uno o più 
modificatori). Qui B ha chiaramente priorità su A. Dal 
momento che ogni parola in una data espressione svolge o 
la funzione di testa o quella di modificatore (a seconda 
della funzione piuttosto che della classe della parola, city è 
una testa in capital city, ma è un modificatore in city 
council), «Attacca A (un modificatore) a B (una testa)» 
copre tutte le costruzioni possibili. Un vantaggio di questa 
operazione è che mette fine al bisogno di avere un qualche 
meccanismo speciale per determinare l’etichetta che 
porterà ciò che essa produce. Se la testa è un nome, allora 
nessuna modificazione potrà cambiare il suo statuto o 
l'etichetta della struttura di cui è testa; se si tratta di un 
verbo, segue una conclusione simile. Bisogna notare due 
cose su Attacca: come il Merge, esso non specifica la 
direzione di attaccatura (se sia alla destra o alla sinistra 
della testa) e, come il Merge, non pone limiti sul tipo o sulle 
dimensioni delle unità da attaccare. 

Per ogni sintagma, il cervello inizierebbe selezionando un 
nome e poi attaccherebbe progressivamente qualsiasi 
modificatore risulti applicato a esso nella numerazione. In 
modo analogo, per ogni clausola, il cervello selezionerebbe 
un verbo e poi prenderebbe dei sintagmi per modificarlo 
(come sono stati prodotti dal processo di formazione dei 
sintagmi controllato da Attacca) e progressivamente li 
attaccherebbe al verbo. Si noti che (e questo è importante 
per quanto segue), in maniera controintuitiva, una 
derivazione di questo tipo non deve procedere nell’ordine 
lineare nel quale le parole verranno emesse alla fine, ma 
procede, per così dire, dal basso verso l’alto - e cioè, a 
partire dal livello inferiore nella struttura gerarchica ad 
albero che costituirà la frase finita. Il motivo è che le parole 
devono prima attaccarsi a ciò con cui sono più strettamente 


associate - per esempio, l’oggetto diretto al verbo (in 
inglese, se non in francese). Si noti anche che gli aggettivi 
vengono attaccati in un ordine preciso: 


12. Aclever young Spanish English teacher. 
13. Aclever young English Spanish teacher. 


Questi due sintagmi non sono sinonimi: (12) parla di un 
giovane e intelligente insegnante di inglese che è spagnolo 
e (13) di un giovane e intelligente insegnante di spagnolo 
che è inglese. Altre varianti semplicemente non sono 
grammaticali in inglese né in un senso né nell’altro: 


14a. *A clever English young Spanish teacher. 
b. *A young Spanish English clever teacher. 
c. *An English clever Spanish young teacher. 


Chiaramente, l’ordine di attaccatura è un fattore cruciale 
nella creazione di una frase. Inoltre è una componente 
ineliminabile del linguaggio - le parole devono essere 
attaccate luna all'altra secondo un preciso ordine -, ma 
non è specificato né dal Merge né da Attacca. 

Sia il Merge sia Attacca richiedono un qualche 
procedimento di controllo, che assicuri una combinazione 
delle parole accettabile da un punto di vista semantico e 
grammaticale. Il controllo consiste fondamentalmente nella 
comparazione delle caratteristiche degli elementi da 
attaccare per assicurarsi che vi sia una corrispondenza. Un 
nome al singolare non può accettare un modificatore al 
plurale (per esempio, *molti cane). Un verbo che regge un 
solo partecipante non può accettare sintagmi che occupino 
i ruoli di Agente e Paziente (per esempio, *Maria cade 
Guglielmo invece di Maria cade o Maria fa cadere 
Guglielmo). Analogamente, le esigenze di una testa devono 
essere soddisfatte da un modificatore: il verbo see, 
«Vedere» (ad eccezione di alcuni usi idiomatici come yes, I 


see, «sì, capisco»), deve avere un oggetto diretto che abbia 
il ruolo tematico di Paziente e indichi ciò che è stato visto. 
Se qualcuna di queste condizioni non viene soddisfatta, il 
risultato è una frase scorretta. 

Lordine di attaccatura non è scritto nella pietra perché 
l’espressione «la cosa più strettamente associata» è 
soggetta a interpretazione. Un verbo è associato più 
strettamente all'oggetto che subisce l’azione oppure 
all’avverbio da cui è modificato? L'inglese opta per la prima 
interpretazione, il francese per la seconda. O ancora: un 
verbo è legato più strettamente a ciò su cui verte la 
clausola - il soggetto invece del predicato? Questa è la 
scelta dell’hawaiano. Quest'ultima differenza, quella tra 
l'ordine soggetto-verbo-oggetto e l’ordine verbosoggetto- 
oggetto, è meno importante di quanto si possa pensare, 
poiché, come si mostrerà qui di seguito, il primo e l’ultimo 
elemento attaccati a una clausola producono conseguenze 
molto simili. 

Quanto detto finora, sebbene sia per molti versi 
incompleto (un resoconto completo richiederebbe per lo 
meno un intero libro) e forse scorretto in alcuni passaggi, è 
almeno un tentativo di connettere i processi necessari alla 
costruzione di frasi alle facoltà note del cervello umano. La 
domanda che sorge naturale, a questo punto, è quanto 
riusciamo a ottenere della sintassi sulla base di meccanismi 
come quelli appena descritti. Da un punto di vista ideale, 
tutte le caratteristiche genuinamente universali della 
sintassi dovrebbero discendere dal modello qui proposto, e 
la grammatica abbozzata qui, sebbene non generi nessuna 
delle lingue umane moderne, avrebbe portato a una lingua 
praticabile. Dal momento che è universale, oggi essa funge 
da scheletro comune di tutte le lingue moderne: è ciò che 
permette ai bambini di acquisire una delle svariate migliaia 
di lingue che esistono attualmente nel mondo e, in 
circostanze appropriate, di costruirsi lingue del tutto 
nuove. 


Di conseguenza, le prossime sezioni non vanno lette come 
un tentativo di stabilire una grammatica definitiva e 
dettagliata, ma piuttosto come una prova del fatto che 
l’idea generale è corretta: l’idea è mostrare che i tipi di 
strutture e di operazioni qui proposti sono almeno 
potenzialmente in grado di trattare i dati che finora hanno 
richiesto assunzioni più complesse e/o un numero maggiore 
di condizioni. Avverto il lettore, tuttavia, che il resto di 
questo capitolo è piuttosto tecnico - com’é inevitabile, del 
resto. Nessuno studioso serio di sintassi dà credito a delle 
mere affermazioni programmatiche, e a ragion veduta. A 
questo punto va fornita almeno qualche indicazione di 
come funzionerebbe il modello nei dettagli. Chi trova 
noiose o eccessivamente complesse le questioni tecniche 
può saltare direttamente alla sezione conclusiva di questo 
capitolo senza perderci troppo. Nel frattempo noi 
prendiamo in considerazione tre aree - il c-comando, gli 
effetti-isola e il riferimento delle «categorie vuote» -, le 
quali dovrebbero dare almeno l’idea delle proposte che sto 
avanzando. 


Il c-comando 


Sebbene si sia rivelato una delle nozioni più resistenti 
della grammatica generativa, il c-comando resta 
immotivato. Come fa notare Hornstein (2009), la deduzione 
del c-comando a partire dal Merge fatta da Epstein (1999) 
rende il concetto naturale all’interno del Programma 
Minimalista (PM) senza però spiegare perché esso 
dovrebbe necessariamente funzionare nel modo in cui 
funziona. (La spiegazione data dallo stesso Hornstein - cioè 
che il c-comando è quel genere di relazione che ci si 
aspetterebbe da una grammatica minimalista basata sul 
Merge - difficilmente ci fa fare dei passi avanti). Nel 
modello che propongo, l'utilità del c-comando è dubbia. 
Esso non è richiesto per determinare l’ordine dei 


costituenti (Kayne 1994), dal momento che non é richiesto 
nemmeno l’assioma di corrispondenza lineare di Kayne. 
Non è richiesto come condizione per il controllo delle 
caratteristiche, perché oggi questo si fa proiettando le 
caratteristiche della testa sui livelli strutturali più alti dei 
sintagmi. Nel legamento, luogo in cui ha giocato a lungo un 
ruolo cruciale, esso è sempre andato incontro a seri 
problemi empirici. 

Nei modelli generativi standard, per legare 
un'espressione anaforica come herself («se stessa», «si») in 
Barbara admired herself («Barbara ammirava se stessa/si 
ammirava»), l’anafora deve essere c-comandata dal proprio 
antecedente (come in questo caso fa Barbara). Lo stesso 
vale per i pronomi legati, come quelli associati a each X 
(«ogni X», «ciascun/a X») o every X («ogni X», «tutti gli/le 
X»). Ma queste sono relazioni asimmetriche: laddove sia 
l’anafora a c-comandare il proprio antecedente, abbiamo 
dei risultati non grammaticali: 


15a. Barbara admired herself. 
b. *Herself admired Barbara. 
16a. Each boy received his prize. 
b. *His prize was given to each boy (* se his e each 
boy sono coreferenziali). 


Si noti, tuttavia, che in questi casi l’antecedente che c- 
comanda è un soggetto. Quando non lo è, si verifica il 
seguente fenomeno: 


17a. Mike showed Barbara herself as she really was. 
b. *Mike showed herself Barbara as she really was. 
18a. Igave each boy his prize. 
b. *I gave his prize to each boy (stessa condizione 
di 16b). 


Lalbero più semplice per le frasi grammaticali (a) 
combinerebbe [merge] prima showed/ gave con Barbara/ 
each boy e poi showed Barbara/gave each boy con herself/ 
his prize. Ma in quel caso l’antecedente non c- 
comanderebbe mai l’anafora. Infatti, in (17a) e (18a) esso 
sarebbe c-comandato dall’anafora. Barss e Lasnik (1986) 
hanno trattato questo problema come se fosse un problema 
delle costruzioni con il doppio oggetto, ma esso si presenta 
ugualmente tra oggetti e sintagmi aggiunti, come 
testimonia (19): 


19a. Bill gave the money to Barbara for herself (non 
per sua sorella). 
b. *Bill gave the money for herself to Barbara. 


In nessuno dei due casi Barbara c-comanda l’anafora, ma 
nella frase grammaticale (19a) Barbara viene attaccato 
prima di herself, mentre succede il contrario nella frase 
non grammaticale (19b). 

La proposta di Larson (1988) per affrontare questo 
problema era indirizzata specificamente ai casi di 
costruzione con il doppio oggetto, ma potrebbe essere 
estesa (e lo è stata presto) ad altri casi. Come molte altre 
proposte, anch'essa ricorreva a un movimento coperto. Si 
creano ulteriori nodi vuoti; il verbo si sposta in un nodo V 
più alto e il SN si sposta in un SN più alto, formando così la 
struttura mostrata nella figura 5.1. 

In questa configurazione, nota come «conchiglia SV», il c- 
comando dell’O(ggetto) I(ndiretto) da parte dell’O (ggetto) 
D (iretto) rimane nella struttura originale, mentre il 
movimento successivo del SN(OI) in SN e quello del V più 
in basso nella posizione del V più in alto, come mostrato, 
danno l’ordine superficiale richiesto. La domanda che 
(secondo me) non può non essere posta è questa: se il 
meccanismo raffigurato in questo albero non rappresenta 
nulla di ciò che dovrebbe fare il cervello nel processo di 


formazione di queste frasi, che cosa ci fa all’interno della 
grammatica? E, d’altra parte, se il cervello esegue davvero 
questa operazione di spostamento, perché dovrebbe farlo? 
Solo per salvare il c-comando? 

La soluzione di Larson (1988), che è molto adottata, non 
può essere parte del modello che espongo qui, dal 
momento che quest’ultimo evita di introdurre qualsiasi 
operazione che non sia supportata da dati empirici - e il 
movimento coperto è una di queste. A quanto ne so, esso è 
semplicemente stato accettato come parte dell'approccio 
«biolinguistico», senza che ne venissero discusse le 
connessioni (sempre che ne abbia) con il modo in cui il 
cervello produce le frasi, con il modo in cui le operazioni 
della grammatica potrebbero essersi evolute o con 
qualsivoglia altra questione sostanziale che ci si 
aspetterebbe venga affrontata da un approccio che miri a 
unificare linguistica e biologia. Inoltre il c-comando 
presenta altri problemi che la soluzione di Larson non è in 
grado di risolvere. Considerate (20), nel quale un 
costituente che contiene l’anafora c-comanda l’antecedente 
e nel quale nessun movimento nascosto plausibile, e 
indipendentemente motivato, può essere usato per 
rimediare a questa situazione: 





Figura 5.1. Una struttura «conchiglia SV». 





20. Stories about herself make Barbara feel deeply 
embarassed. 


D’altra parte un modello che si basa sull’attaccatura crea 
necessariamente due relazioni, entrambe basate sulla 
sequenza dell’attaccatura e quindi entrambe sia naturali 
sia ineliminabili. Queste relazioni, priorità e finalità, si 
dividono le funzioni precedentemente attribuite al c- 
comando - oltre ad assolverne altre. 

La priorità emerge perché l’attaccatura deve essere 
sequenziale e stabilisce quindi un ordine tra i costituenti 
che è tanto fisso e definito quanto lo è l’ordine lineare in 
cui le frasi vengono pronunciate o scritte. Almeno in un 
senso, si tratta di un ordine più significativo, dal momento 
che si basa direttamente sul grado di vicinanza strutturale 
che i costituenti hanno tra loro. La priorità può essere 
definita in maniera formale come segue: 


21. X è prioritario rispetto a Y sse X è attaccato a una 
struttura Z prima che Y sia attaccato a Z. 


La finalità è significativa in ragione di un altro punto di 
sovrapposizione tra la proposta che avanzo qui e una di 
quelle elaborate all’interno del PM. Come abbiamo visto nel 
capitolo 2, Chomsky (1999) aveva immaginato che le frasi 
fossero scomposte in «fasi» distinte, le quali vengono 
inviate separatamente in maniera sequenziale all'apparato 
fonatorio e in seguito non possono più prendere parte ai 
processi sintattici. I componenti della frase vengono 
assemblati simultaneamente e in parallelo; e l'avvenuto 
assemblaggio di un verbo e dei suoi modificatori (verbi 
ausiliari, ‘argomenti e avverbi), proprio come il 
completamento di una fase chomskiana, rende inaccessibile 
alla computazione l'oggetto sintattico risultante. È logico 
che ci debba essere un argomento che sia l'elemento finale 


- cioè che sia l’ultimo a essere attaccato a un verbo. La 
finalità può essere definita in maniera formale così: 


22. Xe finale in una struttura Y sse X è referenziale e 
nessun altro elemento referenziale può essere 
attaccato a Y. 


Si noti che un’attaccatura finale c-comanda in maniera 
asimmetrica tutti gli altri elementi nella propria clausola e 
perciò rende conto (tra le altre cose) dei casi in cui il c- 
comando funziona correttamente nel legamento - per 
esempio, (15) e (16) -, mentre esclude quei casi in cui non 
lo fa. In (17a) e in (18a), Barbara e each boy hanno priorità 
(rispettivamente) su herself e his prize, mentre nei 
corrispondenti casi cattivi (b) la relazione è inversa. In 
(19a), Barbara ha priorità su herself, mentre in (19b) 
accade il contrario. In (20), il costituente che include 
l’anafora c-comanda l’antecedente, sollevando così un 
problema irrisolvibile, a meno di non stabilire in maniera 
totalmente arbitraria che questo tipo di frasi non rientra 
nella teoria del legamento. Il problema si risolve però 
facilmente una volta che si sia accettato che la priorità e la 
finalità legano. 

Si noti che finalità e priorità si occupano anche di un altro 
caso in cui il c-comando richiede un movimento coperto. Il 
sollevamento del quantificatore ha una storia lunga e 
rispettabile nella grammatica generativa, da May (1977) a 
Hornstein (1995). Esso nacque per rendere conto delle 
interpretazioni identiche di frasi come (23a) e (23b): 


23a. Ogni ragazza ha baciato un ragazzo. 
b. Un ragazzo è stato baciato da ogni ragazza. 


Entrambe le frasi possono significare o Ogni ragazza ha 
baciato un ragazzo particolare oppure Ogni ragazza ha 
baciato almeno un ragazzo o un altro. Fin da principio, la 


questione è stata impostata come un problema di ambito, e 
si supponeva che l’ambito fosse una funzione del c- 
comando. Questo significa che, se un sintagma che 
contiene un quantificatore come ogni ragazzo o ogni 
ragazza c-comanda un sintagma indefinito come un ragazzo 
o una ragazza, quel sintagma potrebbe allora essere 
interpretato sia in senso generale sia in senso individuale. 
Naturalmente, non dovrebbe essere vero il contrario, e così 
(23b) dovrebbe avere solo la prima lettura. Visto che però 
le ha tutte e due, allora il ragionamento ha seguito questo 
corso: deve esserci un qualche punto nella derivazione di 
(23b) in cui ogni ragazza c-comanda un ragazzo. Durante le 
prime fasi della grammatica generativa, quando i passivi 
venivano trasformati in attivi, non sorgeva alcun problema: 
il sintagma quantificato c-comandava quello indefinito a 
livello di Struttura Profonda. Ma quando si stabilì che la 
trasformazione passiva cambiava il significato ed era quindi 
inammissibile, si dovette cercare un’alternativa. Dal 
momento che era coinvolto il significato, la risposta logica 
era quella di fare appello alla Forma Logica (FL, il livello a 
cui le frasi ricevono un’interpretazione) e spostare il 
sintagma quantificato in posizione di c-comando nella FL. 
Questo non produsse cambiamenti sostanziali quando la FL 
divenne l’Interfaccia C(oncettuale)-I(ntenzionale) o SEM 
(antica) perché si avesse un solo livello sintattico. Il 
movimento (manifesto o coperto) avveniva a quel livello; e 
se il movimento era coperto, la copia più in alto veniva 
trattenuta a livello dell'interfaccia C-I, ma veniva 
abbandonata a livello dell’Interfaccia S(enso)-M(otoria) 
dove la frase avrebbe dovuto essere pronunciata. 

Quanto detto sopra suggerisce che questo approccio 
avesse molto più a che fare con il modo in cui si è 
sviluppata la grammatica generativa che non con i dati da 
spiegare - per non parlare del problema generale di come 
la sintassi possa essere resa congruente con ciò che fa il 
cervello. Perché una certa configurazione composta da un 


quantificatore e da oggetti vincolati dovrebbe essere 
trattata in un certo modo e un’altra in un modo diverso? 
Perché le interpretazioni di (23a-b) non dovrebbero 
rientrare tra i meccanismi di base della sintassi? Nelle 
varianti ortodosse della grammatica generativa non si 
trovano risposte a queste domande. Secondo l’approccio 
che propongo qui, queste frasi sono semplicemente degli 
esempi ulteriori dei vincoli generali di legamento. In (23a), 
ogni ragazza si lega a un ragazzo per finalità - e ogni 
ragazza è l'elemento finale. In (23b), ogni ragazza si lega a 
un ragazzo per priorità - e ogni ragazza viene attaccato 
prima di un ragazzo. 

Un’obiezione ovvia all'analisi in termini di priorità e 
finalità è che essa deve fare appello a due meccanismi, 
mentre i resoconti ortodossi ne prevedono soltanto uno. Ma 
questa obiezione va contro lo spirito del PM. Non è una 
riduzione del numero di meccanismi di per sé che conta a 
favore di una teoria; quello che conta è se quei meccanismi 
siano inevitabili nell’assemblaggio delle frasi, se rendano 
conto in maniera naturale dei fenomeni di cui si sostiene 
che rendano conto e se la loro adozione renda possibile 
mettere da parte delle proposte precedenti più complesse 
e/o meno naturali. Sia il c-comando sia la priorità/finalità 
sono conseguenze inevitabili dell’assemblaggio gerarchico, 
ma l'analogia finisce qui. 

Il c-comando non rende conto in maniera naturale dei 
fenomeni di cui dovrebbe rendere conto. Non c’è nulla che 
ci dica perché esso dovrebbe giocare un qualche ruolo nel 
legamento. Al contrario, ci sono delle buone ragioni per cui 
priorità e finalità legano. Le anafore sono referenziali, ma 
non lo sono in maniera indipendente. Devono acquistare il 
proprio riferimento tramite l'associazione con un nome 
pienamente referenziale. Quando entrano in una struttura, 
vanno alla ricerca di tale nome. Considerazioni di tipo 
economico impongono che più il nome è vicino, meglio è. In 
altri termini, esse prenderanno il proprio riferimento dal 


nome più vicino che abbia caratteristiche (genere, numero, 
ecc.) corrispondenti alle loro. La situazione ideale è quella 
in cui quel nome sarà già presente nella struttura - si 
tratterà di un elemento attaccato prima. Se non è così, 
l’anafora deve comunque trovare il proprio referente prima 
che la clausola venga chiusa; altrimenti, sarebbe 
impossibile stabilirne il riferimento. Un’attaccatura finale, 
perciò, funge da extrema ratio. Se, come in (24), le 
caratteristiche dell’anafora non corrispondono a quelle 
dell’attaccatura finale, la frase non è grammaticale: 


24. *Mary mailed a letter to themselves. 


Per quanto concerne il terzo fattore che spinge nella 
direzione della teoria che sto proponendo - cioè il fatto di 
poter fare a meno di dispositivi complessi e/o innaturali -, il 
principio di priorità fa sì che non ci sia più bisogno delle 
conchiglie di Larson, del movimento dei quantificatori e 
delle operazioni coperte che queste cose prevedono. In 
effetti il movimento coperto andrebbe eliminato del tutto da 
qualsiasi grammatica che miri a una qualche plausibilità 
neurobiologica. Se ne è fatto un uso sconsiderato nei 
modelli generativi, in parte per via della sua convenienza 
nella «risoluzione» dei problemi come quelli presentati dai 
dati di Barss e Lasnik (1986), in parte perché le sue 
implicazioni per qualsiasi modello realistico di come il 
cervello davvero produca le frasi non sono mai state messe 
in discussione. Quest'ultimo fatto può essere stato 
giustificato sulla base della distinzione tra competenza ed 
esecuzione e dalla conseguente attenzione che ha ricevuto 
la competenza. Ma il passaggio dalla distinzione tra 
competenza ed esecuzione a quella tra i-linguaggio ed e- 
linguaggio chiaramente aggira questa strategia - il modo in 
cui le frasi vengono messe insieme è parte dell’i-linguaggio 
(che è interno e individuale) e va quindi integrato in ogni 
descrizione complessiva dell’i-linguaggio. Allo stesso 


tempo, non si dovrebbe far passare sotto silenzio il fatto 
che i problemi risolti qui non sorgono da dati empirici, ma 
da un’assunzione teorica - quella secondo cui il legamento 
prevede il c-comando. 


Gli effetti-isola 


Notati inizialmente da Ross (1967), gli effetti-isola 
restringono i domini da cui è possibile fare un’estrazione. 
Considerate gli esempi seguenti: 


25. What did Bill think [Mary had not properly 
explained  ]? 

26. *What did Bill wonder [who explained __]? 

27. *What did Bill deny [Mary's claim that she had 
explained __]? 

28. *What did Bill get annoyed [when Mary tried to 
explain _ ]? 


Mentre what può essere estratto dalla sua posizione 
originaria nella clausola subordinata (25), non può essere 
estratto da una clausola simile in (26), da un sintagma 
complesso in (27) o da una clausola aggiunta in (28). Si 
dice che gli esempi (26)-(28) e altri ambienti (per esempio, i 
SN che fungono da soggetto e le strutture coordinate) 
costituiscono delle «isole (sintattiche)» - una questione che 
è stata oggetto di grande dibattito nella letteratura (per 
esempio, Chomsky 1981, 1986; Boeckx 2008), ma è ancora 
ben lontana dall’essere stata risolta. 

Da quando Ross (1967) li ha scoperti, gli effetti-isola in 
genere sono stati spiegati sulla base del principio di 
soggiacenza. Le prime versioni di questo principio (per 
esempio, Chomsky 1986) guardavano alla soggiacenza 
come a qualcosa che coinvolgeva dei «nodi di legamento» 
che fungevano da barriere per il movimento; versioni 
successive (minimaliste) invocavano invece una qualche 
versione del principio «Fai il movimento più breve». 


Qualunque fosse il meccanismo a cui si faceva appello, 
l’obiettivo era sempre quello di bloccare il movimento, 
soprattutto quello dei pronomi interrogativi, al di fuori di 
clausole incassate a livello molto più profondo, come 
mostrato negli esempi (26)-(28). Tuttavia Belletti e Rizzi 
(2000, p. 27) citano l'affermazione di Chomsky secondo cui 
«non c’è ancora una spiegazione in linea di principio di 
molte condizioni-isola»; a una decina d’anni di distanza 
«non abbiamo ancora una caratterizzazione in linea di 
principio del fenomeno delle isole» (Progovac 2009, p. 
307). Progovac prova a dare una soluzione ingegnosa che 
affronta la questione in maniera completamente nuova: 
tradizionalmente, si è considerato il movimento la regola e 
il fatto che esso fosse bloccato la cosa da spiegare; 
Progovac inverte invece l’ordine e tratta il movimento come 
il caso speciale, sulla base della conclusione che «le isole 
sintattiche non sono una classe naturale» (p. 328). 

Tuttavia, secondo l’analisi che propongo qui, le isole 
sintattiche sono una classe naturale, e dunque un 
resoconto dell’effetto-isola è in linea di principio possibile. 
Per dirla in parole povere, l’idea di fondo è questa: mentre 
il movimento è di norma possibile verso la periferia sinistra 
di una clausola, ogni movimento ulteriore si dà solo se la 
clausola di partenza del costituente che è stato mosso non 
è ancora stata chiusa. La nozione di chiusura è essenziale 
per il modello qui proposto. Sebbene io non conosca 
un’altra versione di grammatica generativa in cui si faccia 
uso di questa nozione, essa è implicita in molti trattamenti 
e in particolare quella che più si avvicina a ciò che sto 
proponendo qui è la nozione di fasi (Chomsky 1999). 
Possiamo definire la chiusura in questo modo: 


29. Una struttura sintattica X è chiusa se X non è un 
modificatore obbligatorio di V. 


Lespressione «modificatore obbligatorio» include (e puo 
essere limitata a) argomenti sottocategorizzati di verbi. Si 
noti che gui non uso la formula «se e solo se» perché, 
mentre (29) è probabilmente tutto ciò che era incluso nella 
GU, in seguito sono diventati disponibili altri modi di 
chiudere le strutture, come si mostra nel capitolo 6. 

Dappertutto si assume che quanto (seguendo una lunga 
tradizione generativa) viene qui descritto informalmente 
come movimento consista di fatto, come sostengono molti 
lavori recenti, nel copiare un costituente già attaccato e 
successivamente eliminare l’oggetto copiato. Questo è 
illustrato dagli esempi che seguono, nei quali una parola 
racchiusa tra parentesi angolari (i segni di minore e 
maggiore, < e >) non viene pronunciata ma indica la 
posizione precedente di un costituente copiato. Si noti che, 
come conseguenza di tutto ciò, un costituente «mosso» è 
sempre legato a un costituente precedente, il che mostra 
l’ubiquità della condizione di priorità nel legamento. 


30a. Mary Bill saw <Mary>, but not Sue. 
b. Who did Bill see <who>? 


Questi esempi non sono problematici: c’è una sola 
clausola. 


31. The man [you saw <the man>] wasn't Bill. 


In questo caso, la clausola tra parentesi modifica la testa 
di un nome, ma non c’è movimento: the man è attaccato in 
entrambe le clausole, ma non viene pronunciato nella 
clausola subordinata. Le due si intendono come 
coreferenziali, ma non c’è legamento. 


32. What [did Mary think [<what> (that) John had 
done <what>]]? 


La clausola interna tra parentesi è un argomento Tema di 
think, e perciò rispetta la definizione data in (29) e di 
conseguenza rimane aperta. Questa relazione non sussiste 
in (33): 


33. *Who did Mary go home [after she had seen 
<who>]? 


Qui la clausola tra parentesi è un modificatore di go, il 
verbo più in alto, ma non è da esso sottocategorizzata e 
quindi non è obbligatoria; di conseguenza, la clausola 
aggiunta è chiusa. 


34. *Where did [the fact [that Mary went <where>]] 
surprise John? 


Qui la clausola all’interno delle parentesi non modifica un 
verbo, ma il nome che si trova fuori dalle parentesi, 
portando alla chiusura. 


35. *What does Mary play tennis and [John plays 
<what>]? 


Qui la clausola tra parentesi non modifica nulla: le 
clausole sono entrambe complete e quindi chiuse. 

Ci sono altri casi che sembrano, a prima vista, dei 
controesempi alla condizione del modificatore obbligatorio: 


36a. *Where is [that Mary went <where>] likely? 
b. Where is it likely [that Mary went <where>]? 


Qui abbiamo un classico caso di quelle che sono state 
chiamate «isole-soggetto». Ma l’essere soggetto di per sé 
non può essere ciò che crea un problema qui, perché in 
altri contesti l'estrazione dal contesto è lecita: 


37. [Who [Bill knew <who>]] shocked all of us. 


38a. Mary says [who Bill spoke to <who>] doesn’t 
matter. 
b. Who Mary says [<who> Bill spoke to <who>] 
doesn’t matter. 


In (37)-(38), è coinvolto un argomento sottocategorizzato, 
perciò viene predetta un’estrazione libera. Ma questo è 
vero anche in (36). L'unica differenza è che mentre that 
(assente, si noti, in (37)-(38)) può essere omesso in (36b), 
non si può omettere in (39): 


39. *Mary went home is unlikely. 


Ciò suggerisce che il that in (36a) sia diverso (o stia 
svolgendo una diversa funzione) dal that in (32) e (36b). 
That, naturalmente, è una parola polifunzionale che funge 
da determinatore (that book, «quel libro»), pronome 
dimostrativo (that is the book, «quello è il libro») e 
complementatore (I think that that is the book, «penso che 
quello sia il libro»). Ha anche una quinta funzione, che è 
quella della chiusura. Che questa funzione sia distinta da 
quella di complementatore è mostrato da esempi come 
(40): 


40. I believe that that Obama is president is 
indisputable. 


Il primo that in (40) è un complementatore di frase, ma il 
secondo non svolge nessuna delle prime quattro funzioni 
indicate sopra. In realta, si tratta di un puro indicatore di 
chiusura. 

Per quanto sia troppo goffa per essere proferita in 
contesti normali, (40) è (almeno a mio giudizio) 
perfettamente grammaticale, ed è una contrazione della 
leggermente più lunga, ma meno goffa, (41), la quale è 
senza dubbio grammaticale: 


41. I believe that the fact that Obama is president is 
indisputable. 


Mettete poi a confronto (42) con (43): 


42a. That Mary went home is inconvenient. 
b. Itis inconvenient that Mary went home. 
43a. The fact that Mary went home is inconvenient. 
b. *It is inconvenient the fact that Mary went home. 


Si puo dire (44): 


44. Itis inconvenient, the fact that Mary went 
home. 


Ma (43b) è una semplice dislocazione di (43a), non è un 
suo equivalente nel senso che (43b) è equivalente a (43a). 
(44) quindi non è un controesempio. 

Che la chiusura, e non l’essere un soggetto di per sé, sia 
il fattore critico qui è confermato da un ulteriore esempio 
in cui la clausola che funge da soggetto non contiene that 
(Kluender 2005, esempi 9 e 10): 


45a. *Who does [that she can bake ginger cookies for 
__] give her great pleasure? 

b. Who does [being able to bake ginger cookies for 
__] give her great pleasure? 


(45b) è un po’ strana, ma è di gran lunga più accettabile 
di (45a). Di conseguenza, parrebbe che la non-estraibilità di 
oggetti all’interno di isole-soggetto non sia dovuta a una 
qualche proprietà di queste isole di per sé, ma piuttosto sia 
connessa al fatto che quelle isole siano chiuse o meno. Dirò 
di più sulla chiusura nel capitolo 6. Per ora basti notare che 
la generalizzazione iniziale - il movimento può avere luogo 
al di fuori delle clausole principali e delle subordinate 
sottocategorizzate chiuse - sembra essere valida. 


Il riferimento delle «categorie vuote» 


I fenomeni descritti come «categorie vuote», «costituenti 
nulli» o sintagmi non espressi foneticamente (Jelinek 1984; 
Huang 1984; Lasnik e Uriagereka 1988) sollevano un 
problema serio per i resoconti empiristi dell’acquisizione 
della lingua. Come fanno i bambini a imparare in maniera 
induttiva il riferimento di costituenti inaccessibili a 
qualunque senso? A quanto ne so, nessun empirista ha 
affrontato seriamente tale questione. Ci sono rari tentativi 
che non sono molto più che dei giochetti con la notazione, 
ma anche questi si occupano solo di casi come le domande 
WH? e i passivi (si veda Pickering e Barry 1991), nei quali la 
relazione tra lo spazio vuoto e il referente è piuttosto 
trasparente. Di sicuro, non si occupano mai di casi come 
questi: 


46a. Mary is too angry_ to talk to . 
b. Mary is too angry _ to talk to her. 
47a. Mary needs someone to work for_. 
b. Mary need someone _ to work for her. 


In questi casi non si è «mosso» niente, quindi non c’è 
nulla che possa essere ricondotto alla sua posizione 
«originaria». Inoltre, c’è l'ulteriore complicazione che nelle 
frasi (b) la sostituzione della seconda categoria vuota con 
un pronome cambia sia il suo referente sia quello della 
prima categoria vuota. 

Supponete di usare per questi casi lo stesso trattamento 
usato per il legamento delle anafore manifeste - e cioè, i 
princìpi di priorità e finalità, con il principio di priorità che 
si applica prima, se possibile, e quello di finalità che 
fornisce il referente mancante. Il processo è algoritmico e 
inizia con lo spazio vuoto incassato più in fondo, che è il 
secondo sia in (46a) sia in (47a). In (46a) questo spazio 
vuoto non riesce a trovare un antecedente che venga 


prima; si rivolge percio all’elemento finale all’interno della 
struttura che ha talk to come testa e scopre che anche lì c’è 
uno spazio vuoto e che, quindi, non è in grado di fornire un 
referente. Da qui procede all'elemento finale, che è Mary 
ed è referenziale. Poiché non ci sono altri oggetti 
referenziali e uno spazio vuoto, a differenza di un pronome, 
non può cercare il proprio riferimento al di fuori della 
frase, il primo spazio vuoto resta senza riferimento e viene 
interpretato come un generico - anyone -, come mostra il 
fatto che (46a) è sinonima di (48), che è il suo equivalente 
senza spazi vuoti: 


48. Mary is too angry for anyone to talk to her 
(Mary). 


In (47a) il secondo spazio vuoto trova un antecedente che 
lo precede, someone. Sebbene someone non abbia un 
riferimento definito, è comunque un elemento referenziale, 
quindi il secondo spazio vuoto si riferisce a esso. Il primo 
può ora riferirsi all'elemento finale, Mary. Si noti che in 
nessun caso due spazi vuoti nella stessa clausola possono 
riferirsi allo stesso oggetto. Si assume che tutti i 
partecipanti a un’azione o a un evento siano distinti l’uno 
dall'altro, a meno che la loro identità non venga 
esplicitamente contrassegnata da un pronome riflessivo, un 
indicatore riflessivo nel verbo o un qualche altro dispositivo 
simile. Rimane un mistero che cosa nel cervello/nella mente 
renda questa assunzione quella automatica. 

La sostituzione del secondo spazio vuoto con un pronome 
cambia il riferimento degli spazi vuoti rimanenti, in parte 
perché i pronomi usano algoritmi diversi per stabilire il 
proprio riferimento e in parte perché cambiare la sequenza 
dell’assegnazione del riferimento agli spazi vuoti modifica 
inevitabilmente il riferimento stesso. In (46b) il primo e 
solo spazio vuoto può ora assumere Mary come proprio 
riferimento. Ma il risultato è che Mary diventa il soggetto 


nozionale di talk to e i pronomi non possono assumere altri 
elementi nella stessa clausola come loro antecedenti. Di 
conseguenza, her deve ora riferirsi a un qualche elemento 
femminile non specificato che non è Mary. In (47b) il primo 
spazio vuoto diventa ora il primo a cercare un riferimento e 
incontra immediatamente il precedente someone, che gli 
fornisce un riferimento. Dal momento che someone è ora il 
soggetto nozionale del V più basso, her può assumere Mary 
come proprio riferimento. 

I princìpi illustrati non sono propri soltanto dell’inglese. 
Si possono trovare in un’ampia varietà di lingue e in 
costruzioni di tipo abbastanza diverso. Per esempio, si 
applicano alle costruzioni verbali seriali (Sebba 1987; 
Baker 1989). È molto plausibile che le costruzioni seriali 
siano state piuttosto frequenti nei primi stadi del 
linguaggio, e la loro esistenza segue logicamente da 
un'ipotesi ragionevole su quegli stadi. Possiamo supporre 
che, quando esistevano solo gli algoritmi di base universali 
per la costruzione di sintagmi e clausole, non vi fossero 
restrizioni in merito a ciò che poteva contare come 
modificatore. In quel caso non c’era nulla che impedisse a 
un verbo di modificarne un altro. Tuttavia, così facendo, il 
secondo verbo non sarebbe stato una testa e non sarebbe 
perciò stato in grado di assumere da solo dei modificatori 
(e i modificatori, secondo questo modo di trattare la 
questione, includono gli argomenti di un verbo). Agli spazi 
vuoti lasciati dagli argomenti sottocategorizzati viene 
quindi assegnato un riferimento proprio, come negli esempi 
(46) e (47). 

Considerate i seguenti esempi, i primi due provenienti da 
lingue creole, il terzo da una lingua africana: 


49. mi suti en kii (saramaccano). 
Io sparare lui uccidere. 
«Gli ho sparato e l’ho ucciso». 
50. li pran ti lisyen tue (seselwa). 


Egli prendere piccolo cane uccidere. 
«Ha ucciso il cagnolino». 
51. A’‘si’ba’ be’ le’si‘ gu‘ (gungbe; Aboh 2009). 
Asiba raccogliere riso mangiare. 
«Asiba ha mangiato molto riso». 


In tutti e tre i casi, gli oggetti vuoti dei verbi kii, tue e gu 
prendono come proprio riferimento gli elementi attaccati 
prima (rispettivamente, gli oggetti diretti della clausola 
principale en, ti lisyen e lesi), mentre i soggetti vuoti di 
quei verbi prendono il proprio riferimento dagli elementi 
finali della frase-radice mi, li e Asiba, come predetto dai 
princìpi di priorità e finalità. 

L'algoritmo per determinare il riferimento delle categorie 
vuote fa parte di un meccanismo innato riservato al 
linguaggio? Oppure è semplicemente uno strumento per 
risolvere problemi che ha validità generale e che si trova a 
sfruttare delle relazioni che sono parte di quel meccanismo 
innato riservato al linguaggio? Poiché i meccanismi 
(priorità e finalità) alla base dell’assegnazione del 
riferimento in questo caso sono identici a quelli che 
assegnavano il riferimento alle anafore e agli elementi 
«mossi», poiché specificano relazioni tra i costituenti che 
devono esistere in ogni grammatica che faccia uso di 
processi simili al Merge o ad Attacca per la formazione di 
frasi e poiché lo spazio di ricerca è delimitato da un altro 
elemento del modello che propongo qui, e cioè la chiusura, 
possiamo guardare agli algoritmi che determinano il 
riferimento come a una parte della GU che segue 
logicamente da Attacca, Chiudi e dagli algoritmi per la 
formazione dei sintagmi e delle clausole. 


DOPO LA GRAMMATICA UNIVERSALE 


Nel resoconto che propongo qui, Attacca, Chiudi e gli 
algoritmi per la costruzione di sintagmi e clausole 


costituiscono la totalita della Grammatica Universale intesa 
come l’insieme dei meccanismi computazionali specifici che 
generano la sintassi. Ci sono poi degli elementi vitali per il 
linguaggio che apparentemente sono il risultato di certe 
disposizioni del cervello e che hanno origini oscure. Ne 
incontreremo alcuni nei capitoli 6 e 8, ma riguardano le 
parole e il loro significato piuttosto che la struttura. Gli 
ingredienti della GU sembrano sia minimali sia naturali. 
Senza un procedimento come Attacca, la comunicazione 
non sarebbe mai uscita dallo stadio del proto-linguaggio: 
non solo non ci sarebbero frasi complesse, ma non ci 
sarebbero neppure dei pensieri complessi, dal momento 
che questi ultimi richiedono una struttura sintattica tanto 
quanto le frasi, se devono evitare il pericolo di un aumento 
esponenziale delle ambiguità. La chiusura è una misura 
economica da diversi punti di vista. Si risparmia tempo, sia 
nel pensiero sia nella comunicazione, se le clausole sono 
costruite in parallelo e non in maniera seriale. Si fanno 
meno sforzi, se si riduce lo spazio su cui il cervello deve 
fare computazioni in ogni dato momento, essendo le sezioni 
completate di una frase complessa già state accantonate, 
per così dire, in modo da non dover più essere computate. 
Se le parole si dividono in due categorie, quelle 
concernenti le entità (i nomi) e quelle concernenti le azioni, 
gli eventi o gli stati (i verbi), e se alle singole parole se ne 
devono aggiungere delle altre, allora diventano inevitabili i 
sintagmi che hanno come teste dei nomi e le clausole che 
hanno come teste dei verbi - e si devono sviluppare degli 
algoritmi semplici per produrli. Quegli algoritmi non 
prevedono altro se non l’'Attaccatura seriale; da 
quest’ultima, a loro volta, seguono direttamente due 
operazioni: la Priorità (X è attaccato prima di Y) e la 
Finalità (X è l’ultimo elemento referenziale a essere 
attaccato alla clausola o al sintagma). Queste relazioni 
servono, a loro volta, per specificare quali elementi possano 
riferirsi l’uno all’altro, come nei casi del legamento e delle 


categorie vuote. La Priorita in particolare, come mostrato 
da Pulvermuller (2002), è qualcosa che il cervello può 
seguire in maniera automatica; i meccanismi 
originariamente impiegati per il rilevamento del movimento 
possono indicare in maniera affidabile l’ordine in cui le 
parole vengono assemblate. 

In aggiunta, in ogni versione della GU deve esserci una 
regola sintattica per il dislocamento che permetta che ogni 
costituente di un’unita che non sia stata chiusa venga ri- 
attaccato alla periferia di quella unità - un’operazione che 
può essere applicata in successione ovunque vi siano le 
condizioni appropriate. Dati questi ingredienti e nient'altro, 
se non un lessico adeguato, è possibile generare periodi del 
livello di complessità mostrato in (52)-(54): 


52. Grande cane nero mordere gente cane pensare 
essere pericoloso. 

53. Maria volere sapere chi uccidere antilope grande 
foresta ieri. 

54. Cosa Giovanni dire Giovanni pensare nuova tribù 
andare fare? 


Sto assumendo che i pronomi non siano un'invenzione 
antica e che, a parte un piccolo numero di aggettivi, il 
lessico contenesse poco altro oltre a nomi e verbi e una 
manciata di modificatori, forse non distinti per classe. (Si 
tratta di assunzioni per nulla essenziali alla teoria). Anche 
con queste limitazioni, un bambino in quel periodo non 
avrebbe dovuto fare altro che imparare un vocabolario per 
acquisire il linguaggio. Il resto sarebbe stato fornito dai 
processi automatici già stabiliti nel sistema nervoso. 
Noterete, tuttavia, che gli esempi lasciano a desiderare 
sotto due rispetti: sono abbastanza oscuri sul punto in cui 
un sintagma o una clausola finisce e sul punto in cui inizia 
quello successivo, e chi ha fatto che cosa a chi non sempre 
è ovvio come potrebbe. 


Questo perché la GU presentata qui è radicalmente sotto- 
specificata. Ci sono intere aree della grammatica, come 
l'ordine delle parole, l'accordo e le categorie funzionali, 
sulle quali essa non dice nulla. Forse questo può non essere 
ciò che ci si aspetterebbe dall’ultimo mezzo secolo di 
teorizzazioni sulla GU, ma è esattamente ciò che ci si 
aspetterebbe dall’adattamento evolutivo. L'evoluzione non 
può predire i requisiti di qualcosa che, una volta avviato, 
potrebbe effettivamente sviluppare quei requisiti. Può 
soltanto leggere ciò che vede. Quello che poteva vedere era 
che una specie stava usando degli elementi simbolici 
mettendoli insieme e ha iniziato ad accelerare, espandere e 
rendere automatico tale processo, come ne aveva resi 
automatici molti altri che avevano dimostrato di essere 
adattivi (la corsa bipede, il lancio mirato, la scheggiatura 
del cuneo acheuleano, ecc.). Sebbene nessun aspetto 
specifico o nessun dispositivo del linguaggio fosse di per sé 
adattivo, il pacchetto nel suo complesso, in ogni stadio del 
suo sviluppo, era stato pianificato per incrementare 
l'adattamento. I fattori genetici conseguenti avrebbero 
assicurato che ogni avanzamento si sarebbe diffuso 
all’interno della popolazione. Ciò che non potevano fare (o 
non ebbero il tempo di fare, se la diaspora dall'Africa 
avvenne in questo stadio) era raffinare il motore linguistico, 
soprattutto al fine di soddisfare i bisogni dell’ascoltatore. 

La GU stessa è in genere considerata neutrale rispetto al 
parlante e all’ascoltatore. Dovrebbe rendere più semplice 
parlare per un parlante, rendendo allo stesso tempo più 
semplice per l'ascoltatore elaborare le frasi di quanto non 
sarebbe stato se esse fossero rimaste prive di struttura. La 
domanda è: ce l’ha fatta con l'ascoltatore? Alcune delle 
cose che la GU non è riuscita a chiarire - le posizioni 
relative della testa e dei modificatori, per esempio - 
potrebbero essere risolte dalle convenzioni d’uso. Altre - 
determinare chi ha fatto che cosa a chi, quali costituenti 
erano connessi strettamente in maniera strutturale l’uno 


con l’altro e quali lo erano meno, dove finissero un 
sintagma e una clausola e dove ne iniziassero altri - non 
erano state completamente chiarite o non erano state 
chiarite per nulla. 

Il fatto che manchino dei dettagli nella GU è 
precisamente ciò che conduce all’ampio grado di variazione 
e ai processi costanti di cambiamento riscontrabili ovunque 
nelle lingue di tutto il mondo. Questo capitolo si è occupato 
di ciò che non può variare né cambiare. Almeno una gran 
quantità dei tipi non banali di variazione e cambiamento, se 
non addirittura tutti, emerge da un solo fattore: la 
necessità di specificare le cose che la GU ha lasciato non 
specificate - necessità dettata soprattutto dai problemi che 
i cervelli degli ascoltatori avevano nel processare gli scarni 
output della GU. 

Prima di procedere oltre, è importate sottolineare che i 
difetti che questa GU ristretta presenta riguardo alla 
comunicazione non ci sono nel caso del pensiero. 
Quest'ultimo, infatti, non deve andare tanto lontano. Ciò 
che era uno svantaggio nella comunicazione diventava un 
grande vantaggio da un punto di vista cognitivo. Infatti 
tutto ciò che serviva per il pensiero «astratto» offline erano 
dei concetti reciprocamente connessi. Il marasma dei casi, 
dell'accordo e tutte le altre caratteristiche variabili del 
linguaggio avrebbero potuto essere solo d’impedimento per 
il pensiero. Di norma chi pensa sa già a cosa sta pensando - 
non servono degli indicatori per determinarlo. 

Tenete sempre presente che il cervello si trova in una 
posizione neutrale rispetto alle funzioni cognitive e a quelle 
comunicative. Entrambe coinvolgono gli stessi algoritmi. 
Entrambe connettono gruppi di neuroni con funzioni 
rappresentazionali (siano rappresentazioni di parole o 
concetti) con gli stessi mezzi. Se c'è comunicazione, serve 
un'elaborazione ulteriore - questa è la sola differenza. 
Questa differenza spiega perché, sebbene il pensiero sia lo 


stesso in tutto il mondo, il linguaggio vari in maniera 
significativa a seconda del luogo. 


6 
VARIAZIONE E CAMBIAMENTO 


A questo punto si è conclusa la parte di questo libro 
dedicata all’evoluzione biologica. Il cervello, fecondato 
dalle parole, ha messo a disposizione dei membri della 
specie umana uno strumento che li ha resi capaci di 
acquisire e usare una lingua. Dopodiché è toccato a quegli 
stessi membri fare del proprio meglio con quanto avevano 
ricevuto. Naturalmente, potevano usare i materiali 
linguistici solo nei modi consentiti da quei materiali e 
potevano modificarli soltanto aggiungendo alcune 
caratteristiche, senza alterare o eliminare quelle 
fondamentali. Ne segue che gli sviluppi successivi, sebbene 
vincolati dalla GU, erano in primo luogo delle innovazioni 
culturali; ne segue anche che esse dovevano venire apprese 
in maniera induttiva. Tenete presente che una delle cose da 
spiegare è perché, se la cognizione umana è la stessa 
ovunque nel mondo, le lingue appaiono tanto diverse. 

Questo approccio, che si basa su una distinzione di 
principio tra aspetti non appresi (basati sulla biologia) e 
aspetti appresi della sintassi, differisce in maniera radicale 
tanto da quello empirista quanto da quello innatista. Per gli 
empiristi, tutta la sintassi è appresa in maniera induttiva; 
per gli innatisti, lo sono solo i suoi aspetti meno rilevanti e 
periferici. Di conseguenza, l’asticella da raggiungere per 
giustificare la nostra teoria è molto più alta di quanto non 
sarebbe per ogni altra proposta che ricada chiaramente nel 
campo innatista o in quello empirista. 

Un approccio di questo tipo non deve solo dimostrare di 
rispettare i fatti linguistici, ma deve anche essere in grado 
di gettare più luce su quei fatti rispetto alle teorie 


concorrenti. Dovrebbe essere in grado di spiegare cose che 
gli altri approcci non spiegano, o addirittura ignorano. 
Dovrebbe proporre delle idee che, a loro volta, conducano a 
nuovi obiettivi di ricerca. E dovrebbe saper fare tutto 
questo soprattutto in tre aree che si sono rivelate 
particolarmente ostiche per le teorie del linguaggio 
esistenti. Si tratta della variazione e del cambiamento nelle 
lingue, dell’acquisizione della lingua e del processo di 
creolizzazione e delle lingue che ne derivano, il quale 
combina diversi aspetti delle altre due problematiche. Di 
conseguenza, questo capitolo si occuperà della variazione e 
del cambiamento, mentre i capitoli 7 e 8 tratteranno 
(rispettivamente) l'acquisizione e la creolizzazione. Nel 
capitolo 9, torneremo al problema di Wallace. 


PERCHÉ LA VARIAZIONE E IL CAMBIAMENTO? 


Chomsky (2010, p. 58) ritiene che le domande centrali sul 
linguaggio siano due. La prima è perché esistano delle 
lingue - dopotutto, per miliardi di anni, non c’è stato 
linguaggio nel mondo e innumerevoli specie hanno vissuto 
e sono morte senza averne sviluppato uno. I capitoli dal 3 al 
5 hanno affrontato questo problema, mostrando che solo un 
processo composto di due stadi - una rottura dettata da 
esigenze ambientali con le restrizioni della comunicazione 
prelinguistica, seguita da un incremento guidato dal 
cervello dei comportamenti resi possibili da questa rottura 
- potrebbe aver dato a un certo primate, che per il resto 
non si distingueva in modo particolare dagli altri, delle 
facoltà molto più potenti del necessario. La seconda 
domanda è perché le lingue che esistono siano così tante 
(e, si potrebbe aggiungere, perché appaiano tanto diverse 
luna dall’altra). Possiamo parlare del canto del passero del 
Giappone o della comunicazione dei cercopitechi come se 
intere specie condividessero lo stesso codice. Perché non 


possiamo fare altrettanto con il linguaggio degli esseri 
umani? 

Per dirla con Baker (2001, p. 207 [trad. it. p. 106)]): 
«Perché la nostra dotazione innata non va fino in fondo, 
fino a fissare tutti i dettagli della grammatica?». Baker 
condivide l’idea che la risposta tipica - cioè che questo 
accade perché il linguaggio si adatta alle diverse esigenze 
di diverse culture - non funziona. Non si trovano da 
nessuna parte delle correlazioni stabili tra elementi 
culturali ed elementi linguistici. Lingue tipologicamente 
simili possono essere parlate dai pastori della ragione sub- 
artica e dagli abitanti delle foreste tropicali, ma si può 
anche trovare una gamma di lingue molto diverse parlate 
all’interno di ciascuno di questi gruppi, che sono 
relativamente omogenei da un punto di vista culturale. 

Di fatto, in questo caso, funzionano bene le 
argomentazioni di Deacon (1997) e di Christiansen e 
Chater (2008). Una volta che gli esseri umani ebbero a 
disposizione i materiali per costruire una lingua di 
partenza, era inevitabile che il cambiamento avvenisse a un 
ritmo troppo veloce per poter essere oggetto di selezione 
naturale. Prendete un caso in cui sicuramente il 
comportamento umano è stato incorporato nel genoma: la 
precisione, la flessibilità e la forza della stretta della presa 
con la mano. Abbiamo ereditato dai nostri antenati primati 
che si attaccavano ai rami una buona capacità di base 
nell’afferrare le cose; ma provate a immaginare uno 
scimpanzé mandare dei messaggi con l’iPhone e poi 
ripararci l'orologio (anche ammesso che sia pienamente 
consapevole di quello che sta facendo). Negli esseri umani 
la capacità di impugnare propria dei primati si è evoluta in 
due tipi basilari di presa, la presa di potenza e la presa di 
precisione, probabilmente (e rispettivamente) eseguendo le 
azioni del gettare e del bastonare (Young 2003). Ma si 
tratta di azioni che sono state eseguite in modi simili per un 
lungo periodo, e non di azioni eseguite in modi diversi per 


periodi brevi, come invece deve essere stato per il 
linguaggio, dopo che la sua componente genetica fu messa 
a punto. 

Inoltre, una volta gettate le basi, ulteriori sviluppi 
specifici non potevano più evolvere. Nessuna struttura 
grammaticale, in sé e per sé, offre vantaggi maggiori 
rispetto alle altre da un punto di vista adattivo. 
Padroneggiare integralmente il linguaggio - un eloquio più 
veloce e più sensato, un'elaborazione più rapida e accurata 
- era l’unica cosa che avrebbe potuto incrementare 
l'adattamento. Non solo, come abbiamo visto nel capitolo 5, 
anche la stessa GU era dovuta tanto al bisogno del cervello 
di economizzare le connessioni e creare delle routine 
automatiche e ripetibili quanto alla selezione naturale in 
senso stretto. Ottenute quelle due cose, il cervello aveva 
tutto ciò di cui necessitava. Perché mai avrebbe dovuto 
spingersi oltre? E, anche se si fosse spinto oltre, come 
avrebbe potuto generare non un insieme di caratteristiche 
valide per tutta la specie, ma un profluvio di variabili? 

Rispondere in questo modo alla domanda di Baker (2001) 
solleva però un’altra domanda: se nel momento in cui è 
emersa la specie umana (0 poco dopo) avevamo una ricetta 
genetica per il linguaggio, perché il linguaggio ha dovuto 
svilupparsi ulteriormente? Per quanto concerne il 
linguaggio del pensiero, è probabile che quella ricetta non 
sia cambiata o che non sia stata fatta nessuna aggiunta 
dopo la comparsa dei primi algoritmi sintattici - e noi 
sappiamo quanto essa sia funzionale al proprio scopo. 
Come mezzo di comunicazione, superava di diversi ordini di 
grandezza l'efficienza della comunicazione di qualsiasi 
animale - e, se è per questo, anche il proto-linguaggio suo 
predecessore. 

Non c’è una sola risposta a questa ulteriore domanda. 
Molti fattori hanno contribuito a dare vita allo stato di cose 
in cui ci troviamo ora - fattori che hanno operato prima da 
soli e poi insieme, producendo la variazione e il 


cambiamento. Tenete presente che queste due cose sono, in 
realtà, una sola. Il cambiamento è semplicemente 
variazione su un asse temporale, come è stato prima 
chiarito da Weinreich et al. (1968) e poi ulteriormente 
sviluppato nei lavori di Labov (1972) e dei suoi colleghi. Di 
conseguenza, possiamo trattare entrambi come due diverse 
facce di un unico fenomeno: quello che accade quando si 
abbia a disposizione una GU che fornisce il blocco 
principale di mattoni per costruire il linguaggio, ma non 
tutti i mattoni utili o indispensabili a chi lo usa. 

A quanto ne so, nessuno ha affrontato in questo modo il 
cambiamento e la variazione delle lingue. Alcuni studi in 
passato si sono concentrati sulla classificazione e la 
descrizione di diversi generi di cambiamento. Altri più 
recenti si sono focalizzati sulla distinzione tra classi di 
cambiamento «internamente motivate» ed «esternamente 
motivate» (Jones e Singh 2005; Hickey 2010). Per alcuni 
dei primi studi generativi, come King (1969), era naturale 
vedere il cambiamento attraverso le lenti dei sistemi di 
regole grammaticali - e si dividevano i cambiamenti in casi 
di aggiunta, perdita, riordino o semplificazione di regole e 
di ristrutturazione delle forme sottostanti. In modo 
altrettanto naturale, le grammatiche generative successive 
videro il cambiamento come «un percorso essenzialmente 
casuale all’interno dello spazio delle possibili combinazioni 
di impostazioni dei parametri» (Battye e Roberts 1995, p. 
11). Ayoun (2003, p. 12), che fa notare come i parametri 
sopravvivano anche nel Programma Minimalista, ribadisce 
questa posizione in maniera ancor più categorica: 
«Adottare un valore diverso per un dato parametro 
potrebbe essere l’unico modo in cui una lingua può 
cambiare nel tempo». 

Come tutto ciò suggerisce, coloro che hanno studiato il 
cambiamento linguistico si sono interessati più a come le 
lingue cambino che al perché lo facciano. Più di trent'anni 
fa, a Breivik e Jahr (1989, p. 1) «sembrò sicuro» arrischiare 


la tesi estremamente moderata «che la linguistica storica 
abbia ormai oltrepassato quello stadio in cui tutte le cause 
del cambiamento linguistico sono sconosciute» (corsivo 
mio). Ma tutti i saggi contenuti in quella raccolta si 
occupano di cambiamenti particolari all’interno di lingue 
particolari e non viene proposta nessuna teoria generale 
del cambiamento linguistico. Quindici anni dopo una fonte 
traeva questa conclusione: «Sebbene il prestigio di una 
varietà particolare giochi un ruolo importante, i 
cambiamenti linguistici non possono mai essere predetti» 
(Dirven e Verspoor 2004, p. 204). 

Di conseguenza, mentre l’orizzonte complessivo in cui si 
muoverà questo capitolo può sembrare abbastanza 
familiare nei suoi dettagli, la trattazione non lo è. Aprirci 
una nuova strada, per quanto all’interno di un territorio già 
parecchio esplorato (e, come suggerito prima, il territorio 
della linguistica diacronica sarà anche già molto esplorato 
ma non è affatto ben mappato), dovrebbe comunque 
consentirci di guardare con occhi diversi lo scenario che ci 
troviamo di fronte. È auspicabile che questo possa aiutarci 
a mostrare perché, quando si tratta di cambiamento e 
variazione, le lingue si comportino come si comportano. 


INSTABILITÀ INTRINSECA 


Il primo fattore a cui prestare attenzione è forse quello 
più difficile da sradicare: l’intrinseca instabilità degli 
elementi fonetici. Lo spazio fonetico - l’area entro la quale i 
suoni linguistici vengono prodotti - è, per via della 
struttura dell'apparato fonatorio umano, privo di chiari 
confini interni. Questo è evidente soprattutto nel caso delle 
vocali, ma vale anche per le consonanti. Queste ultime, in 
linea di principio, possono essere articolate in punti ben 
distinti, ma nella pratica questi ultimi variano in ragione di 
molti fattori come, per esempio, il fatto che un suono 


compaia all’inizio, in mezzo o alla fine di una parola o quali 
altri suoni occorrano nelle sue immediate vicinanze in ogni 
data occasione. Da un punto di vista oggettivo, tutti i suoni 
del parlato sono continui, ma la percezione che ne hanno 
gli esseri umani è categorica. Questo significa che, sebbene 
sia impossibile tracciare linee non arbitrarie tra due suoni 
adiacenti sulla base dell’evidenza acustica, gli esseri umani 
inevitabilmente sentiranno o lo «stesso» suono due volte 
oppure due suoni distinti. Questo in parte accade perché 
sono tanto i contrasti fra suoni quanto i suoni stessi a 
permetterci di riconoscere una parola e distinguerla da 
altre simili. 

Linstabilita fonetica dà luogo a un insieme di variabili che 
possono poi essere spinte in direzioni diverse da una 
varietà di fattori extralinguistici di natura sociale, culturale 
o anche semplicemente statistica. Le fluttuazioni casuali 
nella frequenza di certe varianti particolari possono 
raggiungere un punto di non ritorno e accelerare il 
cambiamento categorico. Alcune pronunce diventano di 
moda, forse perché i gruppi che le usano acquistano più 
prestigio; mentre altre, usate da gruppi più svantaggiati, 
vengono declassate negli inferi delle pronunce «non 
standard». La totale arbitrarietà di questo fenomeno è 
illustrata perfettamente dal destino sociale delle due 
varianti fonetiche del passato di eat, «mangiare» (/eyt/ e 
/et/) in inglese britannico e americano, rispettivamente. Nel 
Regno Unito /et/ è la pronuncia dei ceti elevati, mentre 
/eyt/ quella dei ceti più bassi; negli Stati Uniti è il contrario. 

Le conseguenze dell’instabilità fonetica non si limitano 
alla fonologia. Gli effetti di increspatura diffondono 
instabilità ad altri livelli linguistici. Cambiamenti nella 
pronuncia possono rendere irriconoscibili le parole nel giro 
di poche migliaia di anni, cosicché, anche se una lingua 
fosse stata determinata fin nei suoi più piccoli dettagli da 
fattori genetici, il suo lessico sarebbe comunque ancora 
soggetto a cambiamenti. Il modo di parlare rapido e 


informale, di gran lunga il piu comune in societa composte 
da piccoli gruppi, accelera e intensifica i cambiamenti che 
sorgono a partire da altre cause. Entro certi limiti, questo 
riguarda tutte le parole, ma in misura maggiore quelle che 
hanno dei prefissi o dei suffissi flessionali. Linformazione 
grammaticale tende a essere espressa all’inizio e 
specialmente alla fine delle parole, ma è proprio qui che 
l'instabilità fonetica ha un impatto maggiore. I suoni 
all’interno delle parole cambiano in maniera relativamente 
lenta perché sono pronunciati sempre (più o meno) allo 
stesso modo. Ma i suoni nelle zone periferiche di esse 
entrano in contatto con un’ampia gamma di suoni diversi 
provenienti dall'inizio e dalla fine delle altre parole 
immediatamente adiacenti. Di conseguenza, i suoni 
periferici spesso si modificano o vanno persi del tutto, 
causando degli effetti di increspatura che si diffondono a 
tutti i livelli, dalla morfologia grammaticale alla sintassi - 
come quando (per esempio) i suffissi che esprimevano i 
tempi verbali in latino divennero  indistinguibili o 
scomparvero del tutto, facendo sì che le lingue figlie del 
latino li rimpiazzassero con perifrasi che utilizzavano verbi 
come «avere» o «essere». 

Ma anche altri fattori hanno contribuito alla variazione e 
al cambiamento; di questi il più importante è stato, forse, il 
fatto che la GU fosse sotto-specificata in due modi molto 
diversi. Un genere di sotto-specificazione esisteva perché vi 
erano delle cose sotto-specificate nella GU che, nel discorso 
parlato, bisognava assolutamente specificare. L'altro 
genere di sotto-specificazione erano quei casi in cui 
un'ulteriore specificazione, per quanto non strettamente 
necessaria ai fini della comunicazione, veniva comunque 
vista come un fattore in grado di aumentare l'efficienza 
della comunicazione. 


SOTTO-SPECIFICAZIONI CHE VANNO SPECIFICATE 


Ci sono almeno due aree maggiori per le quali non è 
specificata alcuna struttura nella versione di GU descritta 
nel capitolo 5: l'ordine delle parole e le descrizioni di 
azioni, eventi e stati. 


Ordine delle parole 


Di primo acchito, si potrebbe ritenere che la ragione per 
cui l’ordine delle parole sembra tanto importante nel 
linguaggio derivi dal fatto che esso sfrutta un solo canale di 
produzione di output linguistici per volta. Un messaggio 
può essere comunicato con le parole o i gesti delle mani, 
ma ci sono persone che riescono a farlo usando 
simultaneamente le parole e i gesti; si può quindi 
immaginare una lingua umana che incorpori elementi da 
entrambi - una lingua in cui tutti i nomi siano espressi 
vocalmente, mentre tutti i verbi siano espressi tramite i 
gesti delle mani. Una tale lingua ci farebbe risparmiare un 
sacco di tempo, perché nomi e verbi potrebbero essere 
espressi contemporaneamente. Ma una tale lingua non 
esiste, o almeno non è esistita finora (per quanto ne 
sappiamo). Perciò, probabilmente, la ragione 
dell'importanza dell'ordine delle parole non sta tanto nella 
mancanza di canali per produrre output linguistici, ma 
risiede piuttosto in un requisito per l'elaborazione degli 
input: noi riusciamo a elaborare soltanto le informazioni 
che ci vengono presentate in maniera sequenziale. 

Ad ogni modo, qualunque sia la ragione, la produzione di 
proferimenti in sequenza ci costringe a dare un ordine alle 
parole. Una prima rudimentale forma di ordine deriva dalla 
semplice attaccatura dei costituenti più vicini - il processo 
di attaccatura comincia sempre dai verbi, gli oggetti 
vengono (solitamente) attaccati prima dei soggetti, e così 
via -, ma la disposizione relativa di teste e modificatori non 
viene specificata da nessuna parte nella GU. Poiché il 
linguaggio è lineare e sequenziale, una scelta va fatta. Ma 


poiché il cervello, lungi dal progettare un linguaggio 
ottimale, si limita a soddisfare i propri bisogni di economia 
nelle connessioni e nelle routine automatizzate, non 
vengono fornite istruzioni su come quella scelta vada fatta. 

Le strategie che danno precedenza alla testa e quelle che 
danno precedenza al modificatore hanno una certa 
tendenza a coinvolgere molte, se non tutte, le categorie 
strutturali. Se in alcune lingue i verbi vengono prima dei 
loro complementi, allora in molti casi (probabilmente la 
maggior parte) i nomi verranno prima degli aggettivi. Ma ci 
sono molte eccezioni anche a questa generalizzazione 
(l'inglese è una). Diamo per scontato che le eccezioni 
possano spesso essere il risultato di cambiamenti 
linguistici, come in questo caso; l’esistenza di tali 
cambiamenti è già di per sé un argomento contro qualsiasi 
universale linguistico di principio, e trasversale a tutte 
lingue, che comporti un ordine testa-modificatore. 

Nell’Alto Medioevo, l’inglese antico cambiò il proprio 
ordine da O(ggetto)-V(erbo) a V(erbo)-O(ggetto). 
Esprimendo una visione generativista standard, Lightfoot 
(1991a, 1991b) ha descritto tali cambiamenti come il 
risultato dell’accumularsi di una serie di eccezioni 
all'ordine OV finché, all'improvviso, la struttura di base 
della lingua non è stata rianalizzata come VO. Questa idea è 
stata supportata per quanto riguarda l’inglese antico da 
Koopman (1990) e Stockwell e Minkova (1991), tra gli altri; 
ma Pintzuk (1996, 1999) ha mostrato, sulla base di fonti 
dell’epoca, che non ci fu nessuna rianalisi improvvisa, ma 
piuttosto una lunga competizione tra grammatiche 
alternative che usavano rispettivamente l’ordine OV o 
quello VO. Quella competizione non è ancora del tutto 
finita. L'ordine aggettivo-nome in inglese segue ancora lo 
schema che mette le teste alla fine, proprio delle lingue OV; 
diversamente, le lingue romanze, sebbene discendano (in 
maniera predominante) dal latino, che è una lingua OV, 


hanno portato a termine il passaggio all’ordine testa- 
modificatore per tutte le categorie. 

Come rendere conto, allora, della frequenza di un ordine 
uniforme testa-modificatore? Sembrerebbe che essa sia 
dovuta a un fattore extralinguistico: una preferenza per la 
simmetria molto diffusa tra gli umani, che studi condotti 
con la fMRI hanno mostrato essere supportata da 
un’intensificata attivita cerebrale (Sasaki et al. 2005). Per 
quanto riguarda l’intrinseca instabilità dell’ordine - in 
particolare quando esso riguarda le categorie di Soggetto, 
Verbo e Oggetto -, basta considerare il fatto che nessuna 
lingua nota rispetta un solo ordine categoriale. Tutte le 
lingue si concedono un qualche grado di libertà nella 
distribuzione di queste categorie maggiori, dal momento 
che i parlanti di tutte le lingue hanno l'esigenza 
comunicativa di mettere in primo piano, o portare sullo 
sfondo, certe informazioni. Tutto quello che serve è che 
delle frasi con un ordinamento non canonico compaiano in 
maniera così frequente che alcuni parlanti inizino a 
considerarle prima delle alternative e poi dei veri e propri 
sostituti dell'ordine canonico originario di quella lingua. 


Sistemi tempo-modo-aspetto (TMA) 


La seconda delle aree sotto-specificate che deve essere 
sistemata è quella delle espressioni relative al tempo, alla 
realtà o al grado di completezza di azioni, eventi o stati (in 
termini grammaticali, si parla di tempo, modo e aspetto). Si 
noti che solo poche lingue non marcano in maniera 
obbligatoria tutte queste categorie (per esempio il cinese), 
ma ci sono due cose da sottolineare. In primo luogo, le 
categorie in buona parte si sovrappongono: se un’azione è 
+completata (aspetto), essa deve essere +passata (tempo) 
- eccezion fatta per il cosiddetto futuro anteriore (es. avrà 
lasciato). In secondo luogo, anche laddove non sia 
obbligatorio marcare, ci saranno sempre dei modi opzionali 


per esprimere la categoria. Percio, il possesso di un sistema 
tempo-modo-aspetto (TMA) è un presunto candidato allo 
stato di universale linguistico. Tuttavia l’assenza di un 
qualche schema universale per esprimere quelle categorie 
- e anzi, la grandissima varietà di categorie scelte e di 
mezzi impiegati - depone contro un tale stato. 

I mezzi includono (ma non si limitano necessariamente a) 
le flessioni verbali e le particelle libere, le quali possono 
essere obbligatorie o opzionali, e in entrambi i casi possono 
precedere o seguire il verbo. Nel modello più semplice che 
possiamo concepire, ci sarebbe solo un marcatore per il 
tempo (il passato opposto al non-passato), un marcatore 
per il modo (le cose che non sono ancora accadute o 
potrebbero non accadere mai, e cioè le cose irreali, opposte 
alle cose che sono accadute o stavano ancora accadendo, e 
cioè le cose reali) e un marcatore per l’aspetto (le azioni 
continue o ripetute opposte alle azioni singole e puntuali). 
La forma zero (la radice del verbo, senza marcatori) 
svolgerebbe il compito di caso non marcato (il caso più 
atteso, quello più frequente): il passato per il tempo, il 
reale per il modo, il completato per l'aspetto. Si noti, 
comunque, che il «passato» può essere calcolato a partire 
da due diversi punti di riferimento: il momento presente (la 
norma nelle lingue europee) o la locazione temporale del 
tema del discorso che si sta facendo (la norma nelle lingue 
creole e in molte lingue dell’Africa occidentale e del Sud- 
Est asiatico, in genere chiamata «passato relativo»). 

Il sistema TMA di molte delle lingue creole è quello che si 
avvicina di più a questo modello (Bickerton 1981, 1984b) e, 
per ragioni che verranno discusse nel capitolo 8, all’inizio 
pensavo che esso dovesse essere specificato dalla GU. Ora, 
però, non la penso più così. Sembra esserci una distinzione 
molto netta tra le cose specificate dalla GU (i processi di 
Merge o Attacca e Chiudi, gli algoritmi per la produzione di 
sintagmi e frasi e le relazioni che ne seguono), presenti in 
tutte le lingue, e le cose che rimangono non specificate 


(l’ordine delle parole, l’accordo, i casi, e molto altro), le 
quali variano a seconda della lingua. Il sistema TMA è una 
di queste variabili; infatti (al di fuori delle lingue creole) è 
difficile trovare due lingue qualsiasi che utilizzino due 
sistemi identici. Per questo, per i parlanti dell’inglese, 
spesso risulta difficile comprendere bene la categoria 
«congiuntivo», anche se il congiuntivo non è nient'altro che 
una sottodivisione della categoria del modo [-reale]. 

Eppure, l’ubiquità con cui il più semplice modello 
concepibile (0 una sua approssimazione) compare nelle 
lingue creole ci dà motivo di sostenere che, anche se il 
TMA non è specificato dalla GU, c’è una tendenza molto 
forte (risultato forse di un miscuglio di fattori percettivi 
legati alla memoria e ad altro) a favore della sua adozione 
ogniqualvolta l'evidenza a favore di un modello alternativo 
non ci sia o sia ambigua. In altre parole, le categorie stesse 
di tempo, modo e aspetto (in quanto distinte dalle loro 
mutevoli esemplificazioni nelle diverse lingue) sembrano 
essere il risultato di un certo modo di sezionare la realtà 
che probabilmente precede la comparsa del linguaggio. Si 
noti che l’elementare sistema creolo (radice più un solo 
marcatore per ogni tempo, modo e aspetto, che produce 
otto diverse forme strutturali) è una combinazione 
dell'apparato strutturale minimo con il massimo di 
copertura semantica. 

Su scala mondiale, i sistemi TMA variano secondo diverse 
direttrici. Una di queste è l'ambito semantico del sistema. 
Alcune lingue hanno dei sistemi TMA che incorporano delle 
nozioni semantiche ulteriori rispetto alla triade 
tempo/realtà/evento che domina i sistemi TMA in generale. 
In molte lingue si ha la cosiddetta «evidenzialità», che 
codifica cose come il modo in cui l'informazione contenuta 
in una frase è stata ottenuta - se a partire dall'esperienza 
del parlante (nel qual caso può essere indicato il canale 
sensoriale specifico), se per sentito dire (nel qual caso può 
essere esplicitamente marcato se l’informatore sia stato 


testimone o meno dell’evento osservato), se sulla base di 
un’inferenza plausibile, se sulla base di una speculazione o 
di una conoscenza generalmente accettata - e se 
l'informazione sia stata ottenuta di recente o in un passato 
più lontano. La maggior parte delle lingue dotate di 
evidenzialità codifica solo un paio di queste distinzioni, 
sebbene in alcuni casi estremi una lingua (per esempio, il 
matsés, una lingua dell'Amazzonia; Fleck 2007) possa 
includerne la maggior parte. Questo è solo un esempio (ne 
incontreremo altri) di una caratteristica o necessaria o utile 
per una lingua ma non specificata dalla GU, che può quindi 
prendere una vita del tutto autonoma. 

Un altro modo in cui i sistemi TMA possono variare è 
l'aumento della specificazione. Per esempio, le lingue 
possono dividere la categoria [+passato] in passato 
immediato, recente e remoto. Possono dividere la categoria 
[-reale] in eventi completamente immaginati o in eventi 
futuri possibili, con ulteriori divisioni basate sulle 
intenzioni che il parlante ha per il futuro e/o sulla 
probabilità relativa che l’evento descritto avrà 
effettivamente luogo. Possono dividere la categoria |- 
completato] in azioni continue (ancora in via di svolgimento 
rispetto al punto temporale di riferimento) e in azioni 
discontinue ma ripetute (o che hanno probabilità di essere 
ripetute) su ambo i lati di quel punto di riferimento (per 
esempio, Maria va tutti i giorni al lavoro a piedi, anche se 
non lo sta facendo adesso). Nel complesso (se escludiamo i 
componenti non universali come l’evidenzialità), ogni 
coppia scelta a caso di sistemi TMA dividerà probabilmente 
una stessa area semantica in un numero differente di 
categorie. Ne segue che nessuna di queste categorie avrà 
esattamente lo stesso significato o la stessa funzione in 
entrambe le lingue - proprio come una torta tagliata in 
sette fette avrà fette diverse per dimensioni e contenuto da 
quelle che avrebbe avuto se fosse stata tagliata in dieci 
fette. 


Se i sistemi TMA mostrano un tale grado di variabilita, 
come dobbiamo rendere conto dell’universalita delle tre 
distinzioni basilari passato/non passato, reale/irreale e 
completato/non completato? Per stabilire la prima 
distinzione, anche se si adotta il passato relativo, serve 
soltanto che la memoria episodica archivi gli eventi in un 
ordine seriale che sia sempre recuperabile. Gli esseri 
umani hanno davvero una memoria autobiografica (Conway 
2005; Conway e Pleydell-Pearce 2000): possiamo quasi 
sempre richiamare alla mente l’ordine in cui ci sono 
capitate le cose, anche quando non siamo sicuri delle date 
precise; perciò il passato relativo non dovrebbe sollevare 
alcun problema. Per stabilire la seconda distinzione, tutto 
ciò che serve è che il cervello sia in grado di distinguere tra 
ricordi archiviati e cose per cui (ancora) non c’è un ricordo 
archiviato. La base della terza distinzione è meno chiara 
(come anche la sua importanza), ma questo può 
semplicemente derivare dal fatto che sappiamo ancora 
molto poco sul funzionamento della memoria (e di molte 
altre funzioni mentali). Nel complesso, il misto di 
universalità e variabilità esibito dai sistemi TMA non 
suggerisce né degli universali linguistici né delle invenzioni 
ad hoc; piuttosto, suggerisce che degli universali non 
linguistici sono stati incorporati in vari modi all’interno 
linguaggio. 


SOTTO-SPECIFICAZIONI CHE NON RICHIEDONO 
DI ESSERE SPECIFICATE 


Lintrinseca instabilità dovuta alla continua variazione 
fonetica (inevitabile, dato il genere di apparato fonatorio 
che abbiamo), unita alle sotto-specificazioni della GU - il 
fatto che essa non dia istruzioni dettagliate circa le 
posizioni relative di testa e modificatore, e non specifichi le 
strutture per gli universali non linguistici -, ha reso 
inevitabile che le lingue parlate complete dovessero variare 


e cambiare. Ma le cose avrebbero potuto fermarsi qui. Una 
lingua che avesse selezionato il proprio ordine delle parole 
(obbedendo o meno alla simmetria universale) e avesse 
trovato il modo di esprimere le categorie TMA avrebbe 
avuto lo stesso potere espressivo di qualsiasi lingua 
moderna. Infatti l’esistenza di lingue come quella parlata a 
Riau in Indonesia (Gil 1994) suggerisce che, in linea di 
principio, nulla impedisse tutto ciò. Quello che non è chiaro 
è «perché tutti noi dovremmo avere la capacità di 
apprendere una lingua-madre le cui unità non includono 
solo sintagmi e frasi» (Carstairs-McCarthy 2011, p. 436), 
ma tutte le altre complessità della grammatica. Alla luce 
della lingua di Riau, è ancora meno chiaro perché quelle 
complessità esistano. Ci sono molti studi su come le lingue 
cambino - in particolare studi sulla grammaticizzazione, il 
processo che prende le parole-contenuto e le trasforma in 
marcatori grammaticali che possono poi attaccarsi alle 
parole (Heine e Kuteva 2007, 2012; Givén e Shibatani 
2009), ma ci sono pochi studi sul perché tali complessità 
siano state introdotte. 

Le cose cambiano quando ci accostiamo a questi problemi 
dalla prospettiva di una GU specificata solo in parte. Il 
proto-linguaggio si è evoluto per rendere possibile il 
reclutamento per la saprofagia conflittuale. Ma il 
linguaggio (o piuttosto quella parte di linguaggio fatta della 
GU) non si è evoluto come risposta a un qualche bisogno 
particolare degli esseri umani. Piuttosto, si è evoluto per 
migliorare la velocità e l’accuratezza del cervello 
nell’elaborare parole e concetti. Esso non ha avuto 
successo in quanto aumentava l'adattamento umano, ma in 
quanto soddisfaceva il bisogno di economia e automaticità 
del cervello. Né i cervelli né gli individui avrebbero potuto 
prevedere che le prime parole che crescevano nel proto- 
linguaggio avrebbero alla fine «fornito un formato uniforme 
per tutti i concetti» che «mette insieme i concetti come si 
mischiano le mele e le pere» (Boeckx 2012, p. 498). Né 


avrebbero potuto prevedere che la sintassi sviluppatasi a 
partire dal proto-linguaggio avrebbe creato il più potente 
meccanismo cognitivo mai esistito. 

Tutto questo era ancora un futuro molto remoto, circa 
duecentomila anni fa. Limmediato presente era il fatto che 
quanto messo a punto dal cervello non era ancora ottimale 
ai fini della comunicazione umana. 

Nel capitolo 5 ho detto che le istruzioni fornite dalla GU 
erano più favorevoli al parlante: rendevano le frasi facili da 
creare (il processo, in effetti, era abbastanza automatico e 
non necessitava di alcun intervento conscio). Aggiungete 
ora che, tra gli esseri umani, non vi è una distinzione netta 
tra parlanti e ascoltatori. E questa è stata una fortuna, 
perché parlante e ascoltatore sono due figure 
essenzialmente in conflitto di interessi. Il parlante vuole 
ridurre al minimo l’apparato strutturale di cui fa uso, 
perché esso è dispendioso in termini di energia. 
Lascoltatore vuole invece ricevere i messaggi inviati dal 
parlante nella maniera più precisa possibile, per assicurarsi 
una comprensione corretta. Tuttavia ogni parlante è anche 
un ascoltatore e viceversa, perciò non c’era nessun reale 
conflitto di interessi per coloro che (in quanto parlanti) 
trovavano una frase facile da produrre ma (in quanto 
ascoltatori) considerevolmente più difficile da analizzare e 
comprendere. In altri termini, era nell’interesse di tutti 
rendere le relazioni tra le cose rappresentate nelle frasi più 
chiare e meno ambigue di quanto non fossero sulla base del 
solo scheletro della sintassi. 

Il linguaggio ha intrinsecamente e inevitabilmente una 
struttura gerarchica, e le sue relazioni strutturali 
significative sono tutte gerarchiche e verticali, e non lineari 
e orizzontali. Per il cervello questo non è un problema, 
perché esso è fatto per creare gerarchie e trasformarle in 
strutture lineari. Per quanto ne sappiamo, però, il cervello 
non è altrettanto specializzato nel ritrasformare le strutture 
lineari risultanti nelle loro strutture gerarchiche d'origine. 


Questo si puo fare ma ha un costo, sia in termini di 
computazione sia in termini di rischio di erronea 
interpretazione. I problemi che si annidano in questo 
genere di trasformazione sono almeno tre. 

Il primo è determinare quali parole siano più 
strettamente legate a quali altre. In una struttura 
gerarchica ad albero, questo lo si vede chiaramente: si può 
vedere all’istante cosa è direttamente attaccato a cosa e 
quali unità formino i gruppi raccolti sotto un nodo 
dominante. In una struttura lineare, non si riesce a 
scorgere nulla di tutto questo. Per esempio, prendete una 
frase come: Qui i costumi che a una persona con 
un'educazione media sembrano storia antica persistono nel 
secolo presente. Nulla in questa frase, eccetto la sua 
struttura, ci dice che l’intero sintagma qui i costumi che a 
una persona con un'educazione media sembrano storia 
antica sia il soggetto di persistono (con cui concorda nel 
numero) e prenda il numero plurale dalla propria testa 
costumi. Che in casi come questo, in cui due nomi al 
singolare compaiono tra il plurale costumi e il verbo, ci si 
possa confondere è mostrato dalla frequenza con cui si 
incontrano, anche nei testi scritti, frasi simili a quella in 
esame con un marcatore di concordanza al singolare nel 
verbo (costumi che ... persiste). 

Un secondo problema sorge perché la GU non ha modo di 
mostrare la funzione di diversi sintagmi rispetto al loro 
verbo - cioè il ruolo tematico dei loro argomenti - se non 
attraverso l’ordine delle parole. Ma quest’ultimo può 
funzionare solo per due argomenti e solo se la lingua ha 
una struttura SVO e V è transitivo. In lingue di questo tipo 
sappiamo che il soggetto (in genere l’Agente, se ce n’é uno) 
verrà prima del verbo, mentre l’oggetto diretto (il più delle 
volte un Tema, ciò che subisce l’azione espressa dal verbo) 
lo seguirà. Tuttavia una sequenza di due argomenti non 
marcati dopo un verbo (la cosiddetta costruzione del 
doppio oggetto) non ci dà alcuna indicazione di cosa è cosa. 


(I parlanti dell’inglese lo sanno solo perché esiste una 
costruzione alternativa - in cui l’oggetto indiretto è 
marcato da una preposizione, come in I sent the letter to 
Mary, «Ho spedito la lettera a Maria» - che mostra che 
nella costruzione con il doppio oggetto I sent Mary the 
letter l'oggetto indiretto deve essere Mary). 

Ancora peggio sono quei casi in cui anche il verbo ha una 
stringa di argomenti sottocategorizzati che esprimono 
Mezzo (con/tramite X), Beneficiario (per/a favore di X), 
Tempo, Luogo e così via. A questi non possono essere 
assegnate delle sequenze numerate, perché non saranno 
mai tutti presenti in ogni frase. Supponete che io abbia 
detto Inviato Barbara scatola sua sorella posta martedì. La 
pragmatica e la semantica potrebbero permettere di 
comprendere che quanto intendevo dire fosse: Ho inviato 
una scatola a Barbara per sua sorella via posta martedì. Ma 
come potrebbe esserci una comunicazione efficace, se 
dovessimo elaborare la pragmatica e la semantica della 
maggior parte delle frasi prima di poterle capire? 

Il terzo problema sorge quando dobbiamo determinare 
dove finisca un’unita (sintagma o clausola) di una frase e 
dove inizi quella successiva. Per esempio, in una frase come 
The book Bill sent Mary reminded me of it («Il libro che 
Guglielmo ha mandato a Maria me lo ha ricordato»), il 
nome Mary sembra equidistante dai due verbi sent e 
reminded. Non c’è nulla nella forma della frase che ci dica 
che c’è un confine tra le clausole, che Mary sta alla sua 
sinistra, che la frase non riguarda il fatto che Mary stia 
facendo qualcosa ma che è l’oggetto indiretto di sent e non 
ha alcuna relazione con reminded. Nel parlato, ovviamente, 
l'intonazione può chiarire la questione. Una leggera discesa 
nel tono in corrispondenza di Mary e una leggera salita in 
corrispondenza di reminded potrebbero segnalare dove sta 
il confine. In alternativa, una piccola pausa tra sent e Mary 
potrebbe indicare che ci sono due frasi invece di una 
(stessa stringa di parole, ma struttura diversa): The book 


Bill sent. Mary reminded me of it. Si tratterebbe comunque 
di intonazione e non di sintassi. 

Un genere di confusione leggermente diverso sorge nei 
casi in cui la stessa parola funge sia da nome sia da verbo. 
Una volta ho letto questo titolo su un giornale di Denver: 
Spy Charges Dog Inspectors. Nulla in questo titolo ci dice 
se dovremmo interpretarlo in modo che charges sia un 
verbo e dog un nome («Una spia ha imposto una tassa su [o 
ha accusato] le persone che ispezionano i cani») oppure in 
modo che charges sia un nome e dog un verbo («Le accuse 
di essere delle spie continuano a perseguitare certi 
ispettori»). La disambiguazione è lasciata alla conoscenza 
pragmatica piuttosto che essere fornita automaticamente 
da, per esempio, una particella che segni il confine di un 
sintagma, un marcatore della classe di parole per i nomi o 
verbi o un qualche marcatore che indichi se dog è (o non è) 
un modificatore di inspectors. 

La sotto-specificazione in queste aree non richiede 
specificazione - altrimenti, lingue come quella di Riau in 
Indonesia non potrebbero sopravvivere. Rimane il fatto che 
la stragrande maggioranza delle lingue si è dotata di 
strumenti (che non possono far parte della GU perché 
variano da lingua a lingua, in larga misura in maniera non 
predicibile) che specificano le tre seguenti relazioni: 


A. Relazioni tra parole che sono strettamente connesse 
tra loro. 

B. Relazioni funzionali tra i sintagmi e i verbi che essi 
modificano. 

C. I confini di sintagmi e clausole. 


Va notato che ogni dato strumento non si limita 
necessariamente a svolgere una singola funzione. Alcune 
forme possono assolverne più d’una. Inoltre alcune forme 
possono anche avere un contenuto semantico utile o 


svolgere qualche altra funzione che aiuti a chiarire o 
disambiguare i significati delle frasi. 

Prima di esaminare questi casi nel dettaglio, però, 
dovremmo notare che i mezzi per ovviare alla sotto- 
specificazione delle strutture risultano avere una natura 
sorprendentemente simile, a dispetto delle loro differenze 
superficiali. I rimedi in tutte e tre le aree fanno quasi 
sempre uso (forse senza eccezioni) di alcune particelle di 
materiale fonetico che può essere aggiunto alle frasi in 
quattro modi. Questi modi sono il risultato dell’intersezione 
di due sole variabili: prima/dopo e libero/legato. La 
distinzione tra prima e dopo, come abbiamo visto, è 
imposta al linguaggio dalla sua natura lineare e dal fatto 
che la GU non specifica del tutto l’ordine sequenziale dei 
costituenti. La distinzione tra libero e legato sorge dal fatto 
che le particelle possono essere attaccate direttamente alle 
parole come parti di esse (legate) o possono limitarsi ad 
accompagnarle come delle entità discrete (libere). Per via 
delle conseguenze della velocità della lingua parlata, questi 
stadi di frequente si susseguono nella storia di una lingua: 
le particelle libere possono diventare legate, sebbene 
raramente si attesti il contrario. Le scelte tra questi schemi 
non devono valere per tutte le categorie di una lingua o per 
tutti e tre i tipi di relazioni. Per esempio, le particelle che 
segnalano le funzioni argomentali in inglese (by, to, for, 
ecc.) sono libere e precedono, mentre l’unica particella che 
segnala la persona e il numero per i verbi (la -s della terza 
persona singolare del presente) è legata e sta alla fine. 

Da dove vengono queste particelle? La maggior parte 
proviene dalla stessa fonte: parole in origine dotate di 
contenuto e poi declassate, private di accento, spesso 
accorciate (per esempio, ridotte da due sillabe a una, in 
genere quella accentata) e spogliate di quasi tutto il loro 
contenuto semantico originario. Questo processo, noto 
come «grammaticizzazione», è stato ampiamente studiato 
(tra gli altri da Heine e Kuteva 2007, 2012; Hopper e 


Traugott 2003) e in genere non viene messo in discussione, 
se non per quanto riguarda una questione: la sua 
unidirezionalita - ci si chiede cioè se la grammaticizzazione 
debba sempre trasformare parole-contenuto in parole- 
funzione e mai viceversa. Tuttavia nulla nella teoria che sto 
presentando richiede la unidirezionalità o la sua assenza. 
Le fasi intermedie dello sviluppo di questo processo si 
possono osservare soprattutto nelle lingue creole e in 
alcune lingue dell’Africa occidentale, nelle quali, tra le altre 
cose, si può vedere come i verbi che significano «dare» si 
trasformino in marcatori per il dativo e come i verbi che 
significano «dire» si trasformino in marcatori per frasi 
subordinate fattive (Lord 1973; Sebba 1987). 


Grammaticizzazione delle relazioni tra parole 


Tra le relazioni che vengono grammaticizzate più spesso 
nelle lingue vi sono quelle tra le parole e i nomi che esse 
modificano e quelle tra un verbo e gli argomenti a esso 
associati, più frequentemente il soggetto. Il primo tipo di 
relazioni è molto noto ai parlanti dell’inglese nella forma 
del «genere», poiché quest’ultimo diventa subito un 
problema, non appena un parlante dell’inglese arriva in 
Europa. Ma il «genere» non ha effetti diversi da quelli che 
hanno altri classificatori di nomi che troviamo in swahili o 
in cinese. La sola grande differenza è che ciò che 
chiamiamo «genere» si basa grossomodo sulle distinzioni 
tra «maschile», «femminile» e «neutro», mentre i 
classificatori di nomi si basano su molte diverse proprietà 
dei propri referenti (cose come «umano», «artefatto» e 
«lungo oggetto sottile»). 

In inglese, ad eccezione di qualche forma arcaica 
(authoress invece di author), il genere non esiste se non 
per i pronomi. Tuttavia esso ha ancora delle implicazioni 
per i nomi; per esempio, ship (nave), sebbene non abbia il 
marcatore per il genere, è implicitamente femminile (May 


God bless all who sail in her/*him/*it, «Dio benedica tutti 
coloro che navigano su di essa»), sottolineando in questo 
modo come, in una lingua che ha il genere o dei sistemi per 
classificare i nomi, tutti i nomi debbano essere assegnati a 
una classe o a un’altra, indipendentemente dal loro 
significato. 

In tutte quelle lingue che, a differenza dell’inglese, hanno 
un vero e proprio sistema per marcare il genere o dei 
sistemi per classificare i nomi, gli aggettivi e i determinanti 
(articoli, dimostrativi, ecc.), di solito c'è un marcatore che 
indica la classe a cui appartengono: 


la. Las poemas suyas que me mostraron anoche me 

parecian magnificas. 
«Le tue poesie che mi hai mostrato l’altra sera mi 
sono sembrate magnifiche». 

b. Los cuentos suos que me mostraron anoche me 
parecian manificos. 
«I tuoi racconti che mi hai mostrato l’altra sera 
mi sono sembrati magnifici». 


In questi esempi in spagnolo, articoli, aggettivi e aggettivi 
possessivi sono tutti marcati con il genere della loro testa, 
anche se tra nome e aggettivo possono intercorrere diverse 
parole. I sistemi di classificatori di nomi operano in modi 
simili. In questo caso, però, la concordanza tra i marcatori 
della classe può estendersi anche al verbo, il quale allora 
prende il marcatore della classe cui appartiene la testa del 
sintagma nominale: 


2. Watu wazuri wawili wale wameanguka. 
«Quelle due brave persone sono cadute». 


Wa in swahili è il marcatore che indica un numero di 
esseri umani maggiore di uno. 


Tutto questo suggerisce che la classificazione dei nomi è 
strettamente legata alla concordanza soggetto-verbo. La 
concordanza è solo residuale in inglese - di un insieme 
molto ricco di marcatori per numero e persona, sopravvive 
ormai solo la -s della terza persona singolare del presente 
-, ma abbonda nelle lingue romanze, come sa chiunque 
abbia mai coniugato un verbo in spagnolo o in italiano. 
Essa mostra in maniera non ambigua e automatica, senza 
alcun bisogno di elaborare la struttura sintattica o 
semantica, ciò che è forse la relazione semantica più 
importante all’interno della frase: chi ha fatto cosa. Eppure, 
al pari di tutti gli altri fenomeni che abbiamo discusso in 
precedenza (e a differenza delle strutture di base generate 
dalla GU), le lingue non devono selezionarla per forza. 

Certamente, se lo fanno, si aprono delle altre possibilità. 
Una lingua ricca di concordanze non deve mostrare il 
soggetto (io, noi, tu o voi) in maniera esplicita quando il 
riferimento sia reso pragmaticamente ovvio dalla situazione 
o sia stato stabilito all’interno del discorso: 


3a. Juan se fué ayer. No volvera hasta el ano que 
viene. 
«Giovanni è partito ieri. Non tornerà fino all’anno 
prossimo». 


Il pronome può essere omesso anche quando c’è più di un 
antecedente possibile: 


3b. Juan encontrò a Pedro hoy. Dije que era muy feliz. 
«Giovanni ha incontrato Pietro oggi. Dice che era 
molto felice». 


In linea teorica, la frase potrebbe essere ambigua dando 
adito a quattro interpretazioni: Giovanni ha detto che 
Giovanni era felice, Giovanni ha detto che Pietro era felice, 
Pietro ha detto che Giovanni era felice, Pietro ha detto che 


Pietro era felice. Ma, per quanto siano tutte e quattro 
ugualmente plausibili da un punto di vista puramente 
pragmatico, è molto probabile che la prima sia ciò che si 
intende dire davvero. Il motivo è che generalmente nelle 
lingue la continuità di soggetto è il caso standard: si 
assume che il soggetto di una clausola sia lo stesso di 
quella precedente, a meno che le circostanze non indichino 
il contrario. 

L'aspettativa della continuità del soggetto causa un altro 
fenomeno che di norma non si considera in relazione a cose 
come il genere, ma condivide con quest’ultimo una 
funzione importante. I marcatori del cambio di riferimento 
determinano se, date due clausole consecutive, il soggetto 
della prima sarà lo stesso della seconda (condizione SS) o 
no (condizione SD). Come accade nel seguente esempio in 
zuni, lingua parlata in aree del Nuovo Messico e 
dell’Arizona, il marcatore è spesso attaccato alla prima 
delle due clausole, come una sorta di allerta precoce: 


4a. ho’ kwayi-nan yak’o-nna. 
Io SING-NOM-uscire-SS vomitare-FUT. 
«Uscirò e vomiterò». 

4b. ho’kwayi-p Nemme’ yak’o-nna. 
Io SING-NOM-uscire-DS Nemme vomitare- 
FUT. 
«Usciro e Nemme vomitera». 


Se lo spagnolo avesse un sistema per marcare il cambio 
di riferimento, l’enunciato (3b) potrebbe essere distinto in 
due coppie delle sue quattro interpretazioni indicate in 
precedenza. 

I fenomeni di pura concordanza non si limitano alla 
relazione soggetto-verbo. Nelle lingue polisintetiche, il 
verbo può portare un affisso che lo connette agli altri 
argomenti. (In (5), SM = soggetto-marcatore, OM = 
oggetto-marcatore, VF = vocale finale). 


5. Njuchi zi-na-wa-lum-a alenje. 
Api SM-passato-OM-pungere-VF 
cacciatori. 
«Le api hanno punto i cacciatori». 


(5) è un esempio tratto dal mohawk (Baker 2002). Notate 
che il verbo, zinawaluma, potrebbe da solo fungere da frase 
completa (Li hanno punti). Ma anche quando ci sono sia il 
soggetto sia l'oggetto, come in (5), la radice del verbo lum 
deve essere accompagnata tanto da un marcatore del 
soggetto, zi, quanto da un marcatore dell’oggetto, wa. 

Casi come (5) sfumano nella seconda categoria di 
variabili: i marcatori che mostrano la relazione tra un verbo 
e i suoi argomenti. 


Grammaticizzazione delle relazioni verbo-argomento 


«Chi ha fatto che cosa?» non è l’unica domanda a cui il 
linguaggio deve rispondere. C’é anche «Che cosa è stato 
fatto a chi (o che cosa), per chi (o che cosa), quando, dove e 
come?». Gli argomenti dei verbi hanno molti ruoli, ma la 
GU non fornisce degli strumenti specifici per svolgerli se 
non l’ordine di attaccatura, necessario per il parlante ma 
poco utile all'ascoltatore (è solo una cosa in più da 
elaborare e magari anche fraintendere), dal momento che 
non viene stabilito nessun ordine di attaccatura degli 
argomenti, come si è detto nel capitolo 5. Laddove capiti 
che una lingua attacchi l'oggetto alla destra del verbo e il 
soggetto alla sua sinistra, come avviene in inglese, l’ordine 
delle parole rende possibile distinguere tra i due. Ma 
almeno la metà delle lingue del mondo mette il verbo alla 
fine della clausola e una considerevole minoranza lo mette 
all’inizio. 

Inoltre, anche in inglese l'ordine SVO non viene sempre 
rispettato: 


6. The letter itself I gave to Sue, but the envelope I 
kept. 


In casi come questo, il contesto e la pragmatica rendono 
semplice determinare il senso della frase. Ma immaginate 
se la seconda clausola fosse stata qualcosa del tipo ... but 
the wind the fence broke. Quale sarebbe il significato: «il 
vento ha rotto il recinto» oppure «il recinto ha rotto 
(ostruito) il vento»? In inglese sappiamo che (nei casi in cui 
l'oggetto viene anticipato) OSV è un ordine possibile, ma 
sappiamo anche che SOV è impossibile. Ma in una lingua 
SOV vera e propria, anche se è più comune che il soggetto 
piuttosto che l’oggetto venga prima, non possiamo basarci 
solo su questo per disambiguare. 

Un modo per affrontare il problema è introdurre un 
marcatore per l’oggetto o all’interno del verbo (come 
accade in (5)) o nell'argomento stesso - cioè come parte di 
un sistema di casi. I casi sono di gran lunga la soluzione più 
comune per le lingue SOV. Dryer (2002) ha scoperto che, su 
un campione di oltre cinquecento lingue, il 72 per cento 
(181/253) delle lingue SOV possedeva un sistema di casi 
contro il misero 14 per cento (26/190) di quelle SVO. (Le 
lingue che mettono il verbo all’inizio si posizionano circa a 
metà, con il 47 per cento). Ciò suggerisce che la scelta 
sull'ordine delle parole, una variabile che non rientra nella 
GU, è il fattore determinante per quanto riguarda la scelta 
di un particolare tipo di marcatura per le relazioni verbo- 
argomento. 

I sistemi di casi variano per ciò che concerne la misura 
della loro prolificità, ma tali variazioni sono impossibili da 
predire. Se escludiamo le lingue che ne sono del tutto 
prive, l’inglese è una delle più impoverite. Non marca i casi 
per i nomi o i loro modificatori; i casi espliciti si trovano 
solo nei pronomi, e sono due (nominativo e accusativo: 
I/me, they/them) - salvo si conti anche il genitivo (my/ their, 
ecc.). Tra le più ricche vi sono il finlandese, che di casi ne 


ha 15 (Nelson 1998) o 16 (Holmberg e Nikanne 1993), e 
l’ungherese, che ne ha 19 (Megyesi senza data) o 23, se si 
contano i casi «meno produttivi» (Rounds 2009), oppure 
«dai 17 ai 27» (Thomason 2005, p. 16). Quest’incertezza 
riflette il costante, e largamente irrisolto, disaccordo su che 
cosa sia (o non sia) esattamente il marcatore di un caso. Si 
è addirittura sostenuto (Spencer 2008) che l’ungherese non 
possiede dei marcatori per i casi, ma delle postposizioni 
che esprimono delle proprietà semantiche piuttosto che dei 
ruoli funzionali. 

Il disaccordo sulla classificazione è più una faccenda di 
convenienza descrittiva che non una questione di sostanza. 
Dovremmo ricordarci che ci sono solo quattro opzioni per 
incorporare i materiali non specificati dalla GU. Questi 
possono essere aggiunti prima o dopo le parole che fanno 
da testa, e in ciascuno dei due casi possono essere attaccati 
o come unità libere oppure direttamente alle teste stesse. 
Per convenzione, si considerano come marcatori del caso 
solo i morfemi attaccati alle parole ma non quelli liberi, 
nonostante svolgano funzioni identiche. I problemi di 
definizione nascono quindi semplicemente perché tutti i 
morfemi portano con sé una certa quantità di significato, 
per quanto esile e vago (eccezion fatta per un piccolo 
gruppo, come per esempio la vocale contrassegnata con 
«VF» nella glossa all'esempio (5), che è lì solo per esigenze 
fonetiche). 

Questo diventa molto chiaro quando guardiamo alle 
preposizioni dell’inglese. Tra queste, uno degli esempi più 
nitidi di un marcatore del caso è by, che può indicare uno 
tra due ruoli tematici, l’Agente (arrested by the police, 
«arrestata/o dalla polizia») o il Luogo (sitting by the door, 
«sedersi vicino alla porta»). Nel caso dell’Agente, by non ha 
rivali ed è probabilmente la cosa più vicina al marcatore di 
un caso che esista in inglese. Per quanto riguarda il Luogo, 
esso condivide quella funzione con molte altre preposizioni 
- in, on, at, under, beside, above, e così via - e assomiglia di 


più ai marcatori problematici dell’ungherese. Dovremmo 
lasciar perdere i tentativi forzati di inserire i marcatori 
grammaticali all’interno dei tradizionali compartimenti 
stagni e accettare invece l’idea che ci siano delle 
gradazioni e delle categorie che si sovrappongono l’una 
all’altra, nelle quali ogni dato marcatore può assolvere una 
o più funzioni. Dal momento che lo scopo è sempre lo 
stesso - facilitare per il destinatario l’analisi della frase in 
arrivo -, questo pare un approccio legittimo, ma anche solo 
iniziare a metterlo in pratica nei dettagli ci porterebbe ben 
al di là dello scopo di questo libro. 

Fin qui abbiamo trattato le relazioni funzionali tra i verbi 
e i loro argomenti come se facessero parte di un'unica 
classe. In realtà, per quanto strettamente legate e 
sovrapposte fra loro, le classi sono due: quella delle 
funzioni grammaticali (soggetto, oggetto [diretto], oggetto 
indiretto, ecc.) e quella delle funzioni tematiche (Agente, 
Paziente/Tema, Fine, ecc.). La corrispondenza fra queste 
due classi è lungi dall'essere una semplice corrispondenza 
uno-a-uno. Se c’è un Agente, di solito c’è un soggetto, ma 
non sempre. Quasi sempre ci sarà un Tema o un Paziente, 
ed esso sarà il più delle volte un oggetto; ma se 
l'argomento è uno solo (il che succede spesso con i verbi 
intransitivi), allora esso sarà il soggetto (almeno in inglese), 
perché la frase deve avere un soggetto. Ma laddove ci sia 
una mancata corrispondenza tra le categorie sorgono dei 
problemi inevitabili per qualsiasi sistema per marcare il 
caso. Questo dà origine, tra le altre cose, a quel fenomeno 
noto come «ergatività». 

L'ergatività è un’altra delle direttrici lungo le quali le 
lingue possono variare. Le lingue possono essere 
accusative (che significa che attaccano lo stesso marcatore 
del caso ai soggetti dei verbi transitivi e intransitivi e ne 
attaccano uno diverso agli oggetti dei verbi transitivi) 
oppure ergative (che significa che attaccano lo stesso 


marcatore del caso ai soggetti dei verbi intransitivi e agli 
oggetti dei verbi transitivi). Il basco è una lingua ergativa: 


7a. otsoa etorri da. 
Lupo-DET arrivato è (DET = 
determinatore). 
«Il lupo è arrivato». 
b. ehiztariak otsoa harrapatu du. 
Cacciatore-DET-ERG lupo-DET catturato ha. 
«Il cacciatore ha catturato il lupo». 


Il caso assolutivo (quello in cui ricadono i soggetti dei 
verbi intransitivi e gli oggetti di quelli transitivi) ha 
marcatore zero; il caso ergativo (per i soggetti dei verbi 
transitivi) è marcato da -ak. In altri termini, le lingue 
ergative considerano il ruolo tematico più importante della 
funzione grammaticale. 

In lingue come lo spagnolo, che non hanno dei marcatori 
per i casi, un’ergativita incipiente potrebbe sorgere nel 
modo seguente. Poiché lo spagnolo, a differenza 
dell’inglese, non richiede di esplicitare un sintagma prima 
del verbo, il soggetto dei verbi intransitivi può precedere 
oppure seguire il verbo (per esempio, può occupare la 
posizione che occuperebbe l’oggetto di un verbo transitivo), 
a seconda della novità o dell'importanza del soggetto e del 
verbo. (Il corsivo qui sotto sta a indicare un cambiamento 
nel grado di importanza e non il grado stesso di 
importanza). 


8a. Juan ha llegado. 
«Giovanni è arrivato». 

b. Hallegado Juan. 
«È arrivato Giovanni». 


Ma questo è proprio il genere di sviluppo che, nel tempo, 
può condurre da una lingua con ordine SVO a una con 


ordine VSO. Dal momento che quasi la meta delle lingue 
che mettono il verbo all’inizio ha sviluppato un sistema per 
marcare i casi, che è in queste lingue tre volte più comune 
rispetto alle lingue SVO, potrebbe darsi che, un giorno, in 
spagnolo si sviluppino dei marcatori del caso seguendo le 
orme delle lingue ergative invece di quelle delle lingue 
accusative. In altre parole, è difficile (forse impossibile) 
modificare una qualche caratteristica di una lingua senza 
provocare dei cambiamenti anche in altre caratteristiche, 
talvolta di tipo apparentemente anche molto diverso. 

I vantaggi di grammaticizzare le relazioni verbo- 
argomento non si limitano al fatto di poter elaborare delle 
strutture regolari, ordinate in maniera canonica. Nel 
linguaggio c’è una tensione permanente tra uniformità e 
libertà nell’ordine dei costituenti. Luniformita è più facile 
da elaborare in maniera automatica, ma chi usa il 
linguaggio ha anche altre esigenze. Come suggerisce (8), si 
cercano anche dei mezzi per presentare l'informazione in 
modi che si accordino con quello che il parlante sa (o 
dovrebbe sapere o di cui dovrebbe prendere nota in 
maniera più attenta). Tutte le lingue mostrano i segni di 
questa tensione; tutte variano nel grado di flessibilità 
dell'ordine delle parole. Cio che limita di più questa 
flessibilità è il bisogno da parte dell’ascoltatore di sapere di 
quale verbo un certo sintagma nominale è argomento e 
qual è il suo ruolo tematico. Se per l’ascoltatore è facile 
ricostruire questa informazione (cioè se una lingua ha un 
sistema sufficientemente ricco ed esplicito per marcare 
queste funzioni), allora viene concessa una maggiore 
libertà. Una lingua con un ordine di parole davvero libero è 
qualcosa di fantomatico, proprio come un pranzo davvero 
gratuito - nessuna lingua mischia i costituenti di frasi 
diverse, con buona pace di Evans e Levinson (2009a). Lo 
jiwarli (Austin 2001; Austin e Bresnan 1996) si avvicina 
molto ad avere, e però non ce l’ha davvero, il sistema per 
marcare la concordanza verbale che Jelinek (1984) e altri 


hanno sostenuto essere ciò che autorizza l'ordine libero. 
Dispone però sia di un sistema per marcare i casi sia di 
marcatori per la concordanza con la testa per tutti i 
modificatori della testa di un nome, cosicché la costituenza 
possa essere immediatamente ricostruita anche laddove le 
teste e i loro modificatori siano separati da altro materiale. 
Infatti il principio-guida sembra essere la recuperabilità 
complessiva dell’informazione piuttosto che una rigida 
connessione tra condizioni e prerequisiti. In altre parole, 
sembra che ci sia un ricco buffet di modi per indicare le 
relazioni, buffet dal quale le lingue sono libere di attingere 
qualsiasi opzione soddisfi un certo criterio (che resta 
ancora da specificare) per rendere possibile l'elaborazione 
dell’informazione. 


Grammaticizzazione dei confini tra sintagmi e clausole 


Il terzo tipo di risposta alle limitazioni della GU proviene 
dal fatto che essa non marca specificamente l’inizio o la 
fine delle unità strutturali. Prendete un enunciato come 
John found the money Mary had withdrawn, («Giovanni ha 
trovato i soldi [che] Maria aveva prelevato»). Se non fosse 
accompagnato da un’intonazione distintiva, non potrebbe 
essere distinto da John found the money. Mary had 
withdrawn («Giovanni ha trovato i soldi. Maria si è 
ritirata»). Non basta dire che l'intonazione e il contesto 
permettono sempre di disambiguare tra i due. Il linguaggio 
non è sempre usato in condizioni ottimali. L'ambiente 
circostante potrebbe essere rumoroso, gli ascoltatori 
potrebbero essere distanti, distratti o poco attenti. Perciò la 
ridondanza è ovunque nei dispositivi linguistici - di nuovo, 
probabilmente, più di quello di cui la natura abbia bisogno. 

I confini tra le unità sono marcati da particolari classi di 
parole che vengono attaccate alla fine di sintagmi e frasi. In 
altri termini, i membri di queste classi sono gli ultimi a 
essere attaccati alla loro clausola o al loro sintagma. Qui 


abbiamo un’ampia sovrapposizione con le funzioni di 
elementi già discussi. Per esempio, i marcatori del caso 
possono fungere anche da marcatori di confine sulla destra. 
Altri marcatori di confine hanno solo quella funzione - per 
esempio, i determinanti. L'insieme dei determinanti non 
include i numeri, nonostante i numeri vengano spesso 
attaccati ai sintagmi alla fine, perché alla loro sinistra 
possono ancora essere attaccati dei determinanti: [her 
[three boys]] («i suoi tre ragazzi»), [those [five trees]] 
(«quei cinque alberi»). Ma non possono esserci due 
determinanti all’interno dello stesso sintagma: *[the his 
[friends]] (mentre the friends of his, «i suoi amici», va 
bene), *[my that [book]] (mentre my book is that one, «il 
mio libro è quello», va bene), e così via. Anche se i 
determinanti possono codificare delle informazioni 
semantiche - come, per esempio, se un referente sia noto al 
parlante («definito») -, ci sono altri modi per esprimere 
questo; perciò marcare il confine resta la loro funzione 
primaria. 

Il più delle volte i confini sulla sinistra vengono marcati 
dai complementatori (talvolta chiamati «congiunzioni 
subordinanti» nelle grammatiche non generative). Alcuni di 
essi hanno in aggiunta anche delle funzioni semantiche, 
specialmente quelli che introducono delle clausole aggiunte 
(clausole non sottocategorizzate dal verbo che fa da testa, 
come se, perché, sebbene, ecc.). In inglese, that è un chiaro 
esempio di un elemento che segna il confine tra clausole di 
modo finito, proprio come to è un chiaro esempio di un 
elemento che segna il confine di clausole infinitive: essi non 
hanno significati indipendenti quando si trovano in queste 
posizioni. Ci si deve soltanto aspettare che in molti casi i 
determinanti (gli oggetti che segnano il confine dei 
sintagmi) fungano da fonte per i complementatori (gli 
oggetti che segnano il confine delle frasi). 

Ci sono alcune lingue (una di queste è l’inglese) per cui il 
fatto che tutte le frasi richiedano un soggetto esplicito 


rende impossibile usare i soggetti come marcatori dei 
confini di una clausola, rendendo quindi i complementatori 
meno necessari. Il bisogno di complementatori è maggiore 
in lingue come lo spagnolo, nelle quali il soggetto può 
rimanere sottinteso, come testimoniano (9a) e la sua 
traduzione in spagnolo (9b): 


9a. Who do you think (that) he saw? 
b. Quien crees *(que) vio? 


(Lasterisco prima delle parentesi indica che quanto è in 
esse contenuto non può essere omesso). Tuttavia, in un 
contesto diverso, l'inglese segue l'esempio dello spagnolo 
nel richiedere obbligatoriamente un complementatore: 


10a. The man *(that) saw him was John. 
b. El hombre *(que) le vio era Juan. 


Alla luce di (9), il seguente contrasto sembra a prima 
vista difficile da capire: 


11a. Who do you think (*that) saw him. 
b. The man *(that) saw him was John. 


(Lasterisco dentro le parentesi indica che quanto in esse 
contenuto deve essere omesso). Mentre c’é una grande 
letteratura sul fenomeno rappresentato da (11a) (il 
cosiddetto «effetto-traccia di that»), sono sorpreso di non 
aver trovato nessuna discussione sostanziale su questo 
contrasto o su quello tra questi due contesti e il fatto che 
that sia di solito opzionale, sia nell'ambiente di una 
clausola relativa sia in quello di una completiva. Non ne fa 
menzione neppure un articolo che, citando specificamente 
l’effetto-traccia di that, discute in maniera esplicita le 
differenze tra la complementazione in contesti N e in 
contesti V (Pesetsky e Torrego 2006). 


Riassumendo, mentre in spagnolo il complementatore 
«più puro» è sempre obbligatorio, in inglese è obbligatorio 
in alcuni contesti, opzionale in altri e va omesso 
obbligatoriamente in altri ancora. Riusciamo a dare un 
senso a tutto questo, alla luce dell'idea che la funzione 
principale dei complementatori sia quella di marcare i 
confini delle unità strutturali maggiori? 

Spagnolo e inglese sono diversi in questo: l’inglese, a 
parte alcune eccezioni di poco conto, non marca persona e 
numero del soggetto direttamente sui verbi e deve quindi 
usare dei pronomi soggetto espliciti; lo spagnolo invece non 
ne ha bisogno (o normalmente non li usa). Ne segue che, in 
frasi come (9b), due verbi coniugati si susseguirebbero 
direttamente luno all’altro, se non fosse per il 
complementatore. Dal momento che nelle lingue SVO i 
soggetti marcano il confine della clausola, in spagnolo il 
confine tra la clausola principale e quella incassata non è 
marcato in maniera chiara. Si potrebbe pensare che esso 
sia comunque facile da inferire: un secondo verbo deve 
significare una seconda clausola. Ma le cose non stanno 
sempre così (si vedano gli esempi (50)-(52) nel capitolo 5); 
e anche se stessero così, rimarrebbe almeno un problema 
di interpretazione. L'unico contesto in cui un verbo può 
seguire direttamente l’altro in spagnolo è quello in cui il 
secondo è un infinito, e in questi casi il soggetto del primo 
verbo deve anche essere soggetto del secondo. Questo non 
è vero in (9b). Linferenza necessaria per dare senso a frasi 
come (9b) è ben alla portata delle capacità di elaborazione 
degli ascoltatori, ma l’automaticità dell’elaborazione del 
linguaggio è in parte progettata per minimizzare il ruolo 
delle inferenze. Que ha proprio questo ruolo rispetto al 
marcare i confini e le loro implicazioni: in questo caso 
segnala «Stai pronto ad avere soggetti diversi per V1 e 
V2», svolgendo così un ruolo simile a quello dei marcatori 
del cambio di riferimento. 


I contesti in cui si puo eliminare that sono precisamente 
quelli in cui degli argomenti finali, che sono soggetti di 
clausole subordinate più in basso nella struttura sintattica, 
marcano già il confine della clausola: 


12a. The man [Mary saw] was John. 
b. Ithink [Mary said [the man was John]].2 


Ma laddove l'argomento finale non ci sia e la clausola 
subordinata modifichi la testa di un nome, come in (11b), 
that diventa obbligatorio. Ommetterlo in questi casi 
renderebbe ammissibile la sequenza the man saw him 
(«quell'uomo lo vide»), una frase di per sé completa, 
rendendo was John («era John») un’incomprensibile 
etichetta priva di funzione sintattica («John» era him o the 
man?). In altre parole, omettere that genererebbe 
automaticamente delle frasi-labirinto.? 

Quello delle frasi-labirinto è un fenomeno molto studiato, 
ed è noto per mettere a dura prova la nostra comprensione 
(Christianson et al. 2001; Bailey e Ferreira 2003; Lau e 
Ferreira 2005). Esempi tipici sono: the horse raced past the 
barn fell («il cavallo che fu fatto correre oltre il fienile 
cadde») e while Mary dressed the baby slept in her crib 
(«mentre Maria si vestiva la bambina dormiva nella sua 
culla»). Nel primo caso, the horse raced non ha (al 
contrario di come può sembrare) forma attiva, ma è una 
forma ridotta del passivo the horse that was raced; nel 
secondo, the baby è il soggetto di slept e non l’oggetto di 
dressed. L'esistenza di queste frasi mostra che in inglese 
non c’è un modo sistematico per evitarle. Se non altro, 
però, non c’è neppure un modo sistematico per generarle; 
come suggeriscono questi esempi, possono esserci frasi di 
molti tipi e i casi di frasi-labirinto sono molto rari ma 
trasversali. Tuttavia, se si dovesse’ permettere 
l'eliminazione del soggetto that della clausola relativa, ogni 
frase in cui il that fosse stato eliminato non solo sarebbe 


diventata automaticamente ambigua sul piano strutturale, 
ma avrebbe anche favorito un’interpretazione scorretta, 
proprio come fa (10a). 

Veniamo, infine, ai casi in cui abbiamo l’effetto-traccia di 
that. A prima vista, sembrano quelli più difficili da spiegare, 
dal momento che la sequenza di due verbi implicata da 
(11a) lascia obbligatoriamente non marcato il confine della 
clausola. Tuttavia non devono essere considerati come dei 
casi isolati, ma vanno visti alla luce della distribuzione 
complessiva di that. Naturalmente, è un falso problema se 
that sia una parola con diversi significati o funzioni o si 
tratti invece di più parole, ciascuna con il proprio 
significato e la propria funzione. Il punto è che il suo uso 
obbligatorio in contesti come (11b) - l’unico in cui il suo 
uso è obbligatorio in inglese - crea inevitabilmente 
un'associazione con la clausola relativa (un modificatore di 
N) piuttosto che con la clausola completiva (un 
modificatore di V). Perciò una frase come il citato (es. 11a) 
*who do you think that saw him avrebbe allo stesso tempo 
due disfunzioni: riempirebbe il vuoto lasciato 
dall’estrazione di who (rendendo così più difficile 
identificare il luogo dell’estrazione di who e quindi 
analizzare correttamente la frase) e lascerebbe aperta la 
possibilità che la frase contenga un qualche genere di 
subordinata relativa, un depistaggio che interferirebbe con 
il processo di analisi della frase. 

Per questo, paradossalmente, l’omissione di un marcatore 
esplicito del confine della clausola in questo caso aiuta, e 
non ostacola, la scoperta dei suoi confini, presentando un 
verbo privo di un soggetto immediatamente ovvio e 
forzando l’ascoltatore a identificare quell’elemento 
mancante con il già incontrato who. In breve, sebbene non 
ci sia modo di poterla predire, la variazione (tanto 
all'interno di una lingua quanto tra lingue diverse) si può 
spiegare se guardiamo a come scelte precedenti sulla 
struttura o sulla funzione delle parole influenzino le scelte 


successive. Ciò di cui abbiamo davvero bisogno sono studi 
comparativi esaustivi sulle lingue, che mostrino come i 
cambiamenti successivi siano influenzati dalle sotto- 
specificazioni alle quali una lingua abbia deciso di ovviare 
innanzitutto e dai mezzi con cui essa abbia deciso di farlo. 
In questo modo potremmo iniziare a trovarci nella 
posizione di riuscire a spiegare non solo il come ma anche 
il perché dei cambiamenti linguistici. 


CAUSE DEL CAMBIAMENTO 


La variabilità delle lingue non implica di per sé che esse 
debbano cambiare. È possibile immaginare un mondo in cui 
le lingue siano diverse l'una dall’altra esattamente come 
capita nel nostro, ma nel quale esse non cambino. Una 
volta fatte le proprie scelte iniziali, le lingue avrebbero 
semplicemente potuto rimanere fedeli a quelle scelte. 

È davvero possibile un mondo siffatto? Probabilmente no, 
almeno non se le sue lingue hanno una struttura come 
quella delle nostre - magari non in tutte le condizioni. Ci 
sono diversi motivi per cui le cose stanno così. Quello più 
basilare è forse il fatto stesso che vi sia sotto- 
specificazione. Se la GU non specifica il comportamento di 
qualcosa, non c’è nulla che impedisca a quel qualcosa di 
cambiare. Ci sono poi quei fattori intrinsecamente instabili 
a cui facevamo riferimento in precedenza - l’instabilità 
fonologica e la variazione dell'ordine delle parole -, 
ciascuno dei quali può a sua volta causare altri 
cambiamenti. A fianco di questi, vi è la moltitudine dei 
fattori sociali e culturali che hanno effetti sul linguaggio: i 
cambiamenti di potere e/o di prestigio, lauto- 
identificazione con tendenze linguistiche conservatrici o 
progressiste, la creazione di meccanismi inclusivi ed 
escludenti che spesso produce gli outsider, e così via 
all'infinito. La conquista di un gruppo da parte di un altro 


gruppo puo far si che la lingua dei dominatori influenzi in 
larga misura quella di chi viene conquistato, addirittura 
fino a determinarne la completa estinzione - e in ogni caso, 
come minimo, produce dei cambiamenti più radicali di 
quelli che potrebbero essere prodotti nello stesso arco 
temporale dalla normale usura. Il venir meno di una lingua 
prima dominante può creare un vuoto che viene riempito 
da lingue fino a quel punto marginali o che può dare 
origine a una versione alterata dell’originale. Di questi due 
scenari, quello della conquista è quello in cui si è 
sviluppato l’inglese, mentre molte delle lingue sorte 
nell’area di estensione dell'Impero romano sono state 
influenzate dalla scomparsa della lingua dei dominatori. 
Ancora più radicale è stato il destino di altre lingue che 
sono venute alla luce come risultato diretto del 
colonialismo europeo, per molti versi il fattore 
extralinguistico che ci dice di più sul linguaggio. Nel 
capitolo 8, si parla in maniera diffusa di tutto questo e delle 
sue implicazioni per la natura del linguaggio in generale. 
Nella misura in cui queste situazioni di cambiamento più 
radicale riducono a un bambino l’accesso a dati linguistici 
ricchi e solidi provenienti da una lingua preesistente, egli 
ricade in quelli che sono, a tutti gli effetti, gli stadi più 
primitivi del linguaggio umano. Nel caso più estremo, per 
quanto ipotetico, gli input possono essere a tal punto ridotti 
che quanto rimane è soltanto il puro output della GU - e la 
lingua ritorna così alla sua condizione immediatamente 
successiva alla speciazione che ha dato origine agli esseri 
umani. La sintassi consisterebbe allora soltanto di quelle 
forme basilari descritte nel capitolo 5, le quali, come 
abbiamo visto, sono sufficienti a produrre una lingua 
tutt'altro che ottimale dal punto di vista dell’ascoltatore. In 
realtà, è molto improbabile che questo accada. Nessuno 
degli input che si hanno in natura sarebbe abbastanza 
ristretto. (Un input controllato sperimentalmente sarebbe 
una faccenda diversa, ma ragioni etiche proibiscono di 


condurre esperimenti di questo tipo). Perché ci sia un 
linguaggio, si devono imparare le parole e queste tendono a 
portare con sé delle implicazioni sintattiche. Chi sta 
acquisendo una lingua prende ciò che può e lo inserisce nel 
miglior modo possibile all’interno del quadro offerto dalla 
GU. Se ciò non basta e mancano degli elementi-chiave, 
questi vengono recuperati adattando qualunque cosa sia 
disponibile. 

Ci sono strade ormai parecchio battute usate più volte nei 
processi di cambiamento linguistico e quasi sempre nei 
processi di creolizzazione. Gli articoli indefiniti vengono 
forniti dal numerale «uno», gli articoli definiti dai 
dimostrativi, il modo [-reale] dall’equivalente del verbo 
«andare», l’aspetto [-compiuto] dai verbi locutivi, e così via. 
Se viene persa dell’informazione grammaticale a causa 
dell'erosione dei morfemi legati, si utilizzeranno dei 
morfemi liberi. Se le parole cruciali, quelle che esprimono i 
concetti e le funzioni di cui apparentemente il linguaggio 
non può fare a meno - cose come il possesso, l’esistenza, le 
espressioni riflessive, diversi tipi di domande -, non 
occorrono con frequenza sufficiente per essere apprese 
sulla base degli input, possono comparire delle espressioni 
perifrastiche selezionate tra un ristretto gruppo di 
ingredienti. Per esempio, i riflessivi sono ricavati 
tipicamente dalle parole che indicano parti del corpo, 
anche se nelle diverse lingue creole cambia la specifica 
parte scelta. Il creolo delle Mauritius ha preso la parola 
derivata dal francese per «corpo», mo lekor («me stesso», 
letteralmente «il mio corpo»), come hanno fatto altre trenta 
lingue tradizionali sul campione di sessantadue raccolto nel 
World Atlas of Language Structures, che include anche 
giapponese e igbo. Il creolo di Haiti ha optato per la parola 
derivata dal francese per «testa», tet-li («lui stesso», 
letteralmente «testa-sua»), come hanno fatto altre dodici 
lingue del campione raccolto nel World Atlas. In altri 
termini, quando si verificano degli episodi di riduzione 


degli input, i parlanti sono guidati dalle stesse forze che, in 
uno stadio precedente dello sviluppo del linguaggio, 
avevano guidato i parlanti a creare delle parole-funzione 
importanti a partire da espressioni lessicali più trasparenti. 

Diventa ora possibile porsi un certo numero di domande 
(e forse anche darsi delle risposte) sulla natura del 
cambiamento e della variazione delle lingue che non 
sarebbero sorte sulla base delle teorie precedenti. La teoria 
raggiunge questo risultato attraverso tre cose: primo, la 
distinzione sistematica tracciata fra ciò che può e ciò che 
non può variare nella sintassi; secondo, l’identificazione 
della funzione di elementi molto variabili (che rimediano 
alle sotto-specificazioni della GU); terzo, la suddivisione in 
tre categorie delle funzioni che rimediano alle sotto- 
specificazioni: la marcatura dei confini dei sintagmi e delle 
clausole, la marcatura delle relazioni tra parole connesse e 
la marcatura delle relazioni tra i verbi e i loro argomenti. 
Una volta che sia disponibile questo quadro teorico, 
possiamo porci le seguenti domande (che, però, non sono le 
sole): è possibile stabilire un numero minimo e uno 
massimo di tipologie di rimedi? Nella scelta delle strategie 
per rimediare alle sotto-specificazioni, vi è un qualche 
ordine di implicazione interno, o positivo (se viene scelto X, 
sarà scelto anche Y) o negativo (se viene scelto X, non sarà 
scelto Y)? Se quest'ordine c’è, vale per tutte e tre le 
categorie oppure si tratta di un ordine interno a ciascuna di 
esse? E se non c’è, la scelta delle strategie per rimediare 
alle sotto-specificazioni è determinata interamente da 
fattori contingenti - in una parola, è anarchica? Le lingue 
tendono a focalizzarsi su una categoria particolare: 
pongono rimedio alle sotto-specificazioni in tutte e tre le 
categorie più o meno allo stesso modo, oppure seguono 
strade diverse? E se lo fanno, che cosa porta una lingua a 
scegliere una strada invece di un’altra? È possibile creare 
una tipologia di variazione e cambiamento basata 
interamente sui modi che una lingua ha di affrontare quegli 


aspetti della grammatica che non sono specificati dalla GU? 
Lampiezza e la varietà dei nuovi campi di ricerca futuri 
dischiusi dalla teoria qui proposta sono un'ulteriore riprova 
del suo valore e della sua validità. 

Al contempo, bisogna mettere in chiaro alcune delle 
conseguenze di questo modello - e non piaceranno a tutti. 
Per molti, la cosa più difficile da accettare sarà che una 
grande parte della grammatica di ogni lingua deve essere 
appresa in maniera induttiva, anche dai bambini. La 
struttura della GU può ridurre notevolmente la quantità di 
ipotesi che i bambini possono fare, e fornirà inoltre sia 
delle aspettative sia delle non-aspettative, una o due delle 
quali emergono nell’acquisizione dell'inglese (si veda il 
capitolo 7). Tuttavia, al di là di questo, i bambini sono 
lasciati a loro stessi. 


OBIEZIONI A QUESTO MODELLO 


Mentre scrivo queste parole già mi sembra di sentire i 
cori di protesta dei generativisti ortodossi. Alcuni 
riguardano questioni particolari, altri un problema molto 
generale. Mi servirebbe un altro libro per rispondere a 
tutte le obiezioni particolari. Mi occuperò quindi solo di una 
di esse, prima di rispondere all’obiezione più generale. 
Confido nel fatto che la prima sia la più importante; di 
certo, essa illustra bene come il modello che ho presentato 
qui si differenzi da molti di quelli precedenti (se non tutti). 


Un’obiezione particolare: categorie funzionali 


I lettori avranno probabilmente notato che in questo 
capitolo ho trattato cose come le preposizioni, i 
complementatori e i determinatori non come delle classi di 
parole maggiori a sé stanti, ma come dei modificatori di 
nomi o verbi. Questo va contro praticamente tutti i modi in 
cui questi costituenti sono stati trattati dai generativisti. Le 


grammatiche generative più in voga trattano tutti i tipi di 
parole allo stesso modo. Classi di parole diverse da quelle 
dei verbi e dei nomi sono considerate «categorie 
funzionali», e per quanto riguarda la loro struttura vengono 
trattate esattamente come i nomi e i verbi. Tra l’altro, 
questo significa che esse devono essere delle teste, e in 
quanto tali devono anche avere quello che hanno le teste 
(almeno potenzialmente), e cioè: specificatori (proprio 
come i nomi hanno gli articoli e i verbi gli ausiliari) e 
complementi (proprio come i nomi hanno gli aggettivi e le 
frasi relative, e i verbi hanno oggetti, ecc.). Per esempio, i 
sintagmi nominali sono complementi di determinanti [the 
[black dog]] («il cane nero») e il sintagma determinante che 
ne risulta può allora diventare il complemento di un 
sintagma preposizionale ([of[the black dog]], «del cane 
nero»). 

I generativisti non sembrano per nulla scoraggiati dal 
fatto che, all’interno di un’analisi minimalista, categorie 
come quella di «specificatore» e «complemento» non 
abbiano alcuna ragione di esistere. Chomsky (1995) 
sostiene che non ci dovrebbe essere niente nella 
derivazione di una frase oltre alla numerazione (la lista 
delle parole che saranno incorporate nella frase, insieme, 
naturalmente, a tutte le proprietà di quelle parole) e al 
processo di Merge -e a qualsiasi altra cosa possa essere 
dedotta a partire da quei due ingredienti. Questo insieme di 
assunzioni (o uno molto simile) ben si adatta a una teoria 
che ha di mira «ciò che è virtualmente indispensabile da un 
punto di vista concettuale» - che è poi la convinzione che 
una teoria del linguaggio debba contenere soltanto il 
minimo indispensabile per la produzione della lingua. In 
altre parole, rende esplicito il genere di assunzione che ha 
permeato tutta la miglior scienza che è stata prodotta dai 
tempi di Guglielmo di Ockham, se non prima. 

Che ogni parola debba essere una testa e che ogni testa 
debba essere dotata di uno specificatore e di un 


complemento (o almeno di posizioni in cui elementi del 
genere possano essere inseriti, e quindi posizioni nelle 
quali, se sono vacanti, possano essere mossi altri elementi, 
anche se questi ultimi sono essi stessi teste) non è qualcosa 
che si possa dedurre né dagli ingredienti indicati da 
Chomsky né dalla teoria che sto proponendo. Se queste 
proprietà e relazioni non si possono dedurre a partire dalla 
numerazione e dal Merge (o Attacca, Chiudi e gli algoritmi 
per i sintagmi e le frasi), allora esse sono entità introdotte 
per ragioni indipendenti e non sono concettualmente 
indispensabili. Dovrebbero perciò venire escluse da una 
teoria davvero minimalista. 

La ragione per includerle in trattamenti presunti 
minimalisti rivela un punto debole che persiste attraverso 
tutta la storia della grammatica generativa: le nozioni 
sviluppate in una certa fase di quella storia vengono 
mantenute nelle fasi successive, anche quando i 
cambiamenti all’interno della teoria le rendono non 
necessarie o addirittura nocive. La trinità specificatore- 
testacomplemento si è sviluppata quando l’elemento 
cruciale della sintassi era la teoria X-barra (Chomsky 1972; 
Jackendoff 1977). Nata sulla base di un naturale desiderio 
di uniformità e sistematicità nelle operazioni sintattiche, la 
teoria X-barra stabiliva che il sintagma fosse l’unità 
sintattica di base, che tutte le classi di parole fossero 
potenzialmente delle teste del sintagma e che tutti i 
sintagmi fossero strutturati in maniera gerarchica 
esattamente su tre livelli ciascuno: un sintagma testa SX (S 
= sintagma, X = una qualsiasi classe di parole) suddiviso in 
Spec(ificatore) e X’ (pronunciato X-barra), il quale era a sua 
volta suddiviso in una Testa e in un Comp (lemento). Come 
si è detto nel capitolo 2, la teoria X-barra era stata 
esplicitamente messa al bando almeno dalla versione più 
forte di minimalismo (Chomsky 2007, pp. 4-5), ma a quanto 
pare le sue condizioni rimangono intatte nella maggior 
parte dei trattamenti minimalisti. 


Prima della teoria X-barra, la maggior parte degli studiosi 
di sintassi assumeva un approccio basato sul senso comune 
e trattava le categorie minori come dei modificatori delle 
categorie maggiori. Le uniche ragioni per cambiare questo 
modo tradizionale di vedere le cose sembrano essere le 
considerazioni puramente interne alla teoria descritte qui, 
non considerazioni di carattere empirico. Inoltre, si tratta 
di considerazioni interne alla teoria che ora non sono piu 
parte integrante della teoria stessa. Di conseguenza, il 
modello che propongo non deve assolutamente dare una 
giustificazione per il fatto che distingue le categorie 
lessicali in due classi principali: Teste (suddivise in nomi e 
verbi) e Modificatori (divisi laddove necessario in tutte le 
altre classi di parole). 


Un’obiezione generale: la teoria dei parametri 


Una reazione comune dei generativisti al trattamento 
complessivo del cambiamento e della variazione che ho 
proposto in questo capitolo, e in particolare 
all'affermazione che tutti gli elementi variabili debbano 
essere appresi, è molto probabilmente la seguente: questo 
è senza dubbio un passo indietro! Noi coprivamo un intero 
campo di variazione e cambiamento con una teoria dei 
parametri e dell’impostazione dei parametri che, oltre a 
delle ricche descrizioni linguistiche, offre quella che è di 
gran lunga la più completa spiegazione di come i bambini 
acquisiscano una lingua. Perché dovremmo buttare via il 
lavoro fatto da letteralmente centinaia di studiosi preparati 
che hanno sviluppato la più esplicativa delle teorie? 

Parte della risposta è sicuramente implicita nel 
trattamento dei parametri presentato nel capitolo 2. 
Semplicemente, ce ne sono troppi, e le loro relazioni 
reciproche sono troppo varie e prive di regole perché la 
nozione sia davvero utile. Dire che «il bambino fissa un 
parametro» non ha più contenuto che dire «il bambino 


impara una regola». Inoltre ci sono dei problemi relativi 
all’atto stesso del fissare un parametro. 

Prendete il parametro che fa alzare il verbo (Emonds 
1985; Pollock 1989). Uno dei punti di contrasto tra il 
francese e l’inglese è il posizionamento degli avverbi (e di 
altri elementi, come i marcatori negativi) rispetto al verbo: 


13a. John often kisses Mary. 
b. *John kisses often Mary. 
c. Jean embrasse souvent Marie. 
d. *Jean souvent embrasse Marie. 
«Giovanni bacia spesso Maria». 


Spesso si assume che in tutte le lingue i verbi possano 
assegnare proprietà (cose come i ruoli tematici e il caso) ai 
loro oggetti diretti solo per giustapposizione diretta. Ne 
segue che tutte le lingue devono iniziare là dove finisce 
l'inglese, e cioè, con il verbo immediatamente adiacente al 
proprio oggetto. Se è così, deve essere vero che embrasse 
comincia dalla posizione occupata da kisses in (13a) - e 
cioè, dalla posizione che embrasse occupa in (13d) - per poi 
muoversi alla propria sinistra («si alza», dal momento che il 
movimento verso sinistra è il movimento verso l'alto in un 
struttura gerarchica ad albero) per occupare la posizione 
che occupa in (13c). I parametri vanno impostati sulla base 
dell'input che il bambino riceve, e su questo concordano 
tutti. Ma l’unico modo in cui un bambino può sapere che un 
verbo è stato alzato è osservando le posizioni relative dei 
verbi rispetto agli avverbi, alle negazioni e così via. Perché 
allora «il bambino imposta positivamente il parametro per 
alzare il verbo in francese» dovrebbe essere qualcosa di più 
che un modo pomposo per dire «il bambino nota che in 
francese gli avverbi, le negazioni e così via vengono 
direttamente dopo il verbo»? 

Non abbiamo neppure iniziato a considerare i problemi 
evolutivi che i parametri devono affrontare. Rispetto a tutti 


gli altri generativisti, Baker (2001, 2003) ha osservato piu 
attentamente i parametri nel contesto evolutivo, ma le 
conclusioni che trae sono abbastanza equivoche. 
Considerando l’ampio margine di diversità che può esserci 
tra lingue limitrofe, Baker (2001) rigetta la possibilità che i 
parametri vengano alla luce per marcare una differenza 
rispetto a gruppi potenzialmente ostili, bollando questa 
come «un’esagerazione» - un singolo suono del parlato, 
come nella biblica shibboleth o la pronuncia tipica 
canadese di about, sarebbe stato sufficiente. Eppure, il 
rimarcare l'identità di gruppo, oltre all'esclusione di chi 
non vi appartiene, è precisamente la soluzione che viene 
adottata in Baker (2003). 

In realtà, non è mai esistita una spiegazione evolutiva 
valida dei parametri. Se devono avere una funzione per 
l'acquisizione della lingua da parte dei bambini senza dover 
essere appresi a loro volta, allora devono esser parte della 
GU. Ma se sono parte della GU, devono essersi diffusi in 
tutte le specie. Come è possibile che delle differenze che 
distinguono un gruppo dall’altro diventino patrimonio di 
tutti? Del resto, si può capire perché il genoma avrebbe 
specificato degli elementi linguistici invarianti; ma per 
quale ragione avrebbe dovuto dare anche delle ricette per 
le variazioni e in che modo queste ricette sarebbero entrate 
a far parte del genoma stesso? Domande come queste 
rimangono non solo senza risposta, ma non vengono 
neppure mai sollevate. 

Infine, sia alcuni lavori recenti dei generativisti sia alcune 
conclusioni esplicite raggiunte da almeno un generativista 
contribuiscono a svalutare ulteriormente il concetto di 
parametro. I lavori recenti riguardano i cosiddetti 
«microparametri» (Kayne 1996, 2005; Vangsnes 2005; Son 
e Svenonius 2008). Un microparametro è un punto della 
grammatica che differisce all’interno di un gruppo di lingue 
strettamente legate (per esempio, la famiglia delle lingue 
romanze o le lingue scandinave) o anche di dialetti della 


stessa lingua, e in genere riguarda soltanto una certa 
caratteristica grammaticale minore. Esempi in inglese 
includono la possibilita di invertire soggetto e ausiliare 
dopo wonder nell’inglese che si parla a Belfast (I wonder 
could he be buying more beer, «Mi chiedo se possa 
prendere dell’altra birra») e l’uso della costruzione for-to 
per introdurre le infinitive in alcune varianti dell’inglese 
americano parlato in Arkansas o in Oklahoma (He’s gone 
for to buy more beer, «E andato a prendere dell’altra 
birra»). La scoperta dei microparametri aumenta di alcuni 
ordini di grandezza il numero di parametri che devono 
esistere, e parimenti riduce la plausibilita della 
supposizione che un insieme di parametri da fissare sulla 
base dell'esperienza formi una parte della dotazione 
biologica di ogni bambino. 

Tuttavia, se i parametri (micro e macro) sono tanto 
numerosi e tanto diversi da poter essere esclusi dalla GU e 
sono così mischiati che non c’è da nessuna parte, 
nonostante le speranze originarie, un piccolo gruppo di 
parametri-capestro la cui impostazione fisserebbe al 
contempo un’intera gamma di altri parametri, allora le 
impostazioni dei parametri si riducono a un insieme di fatti 
sulle lingue particolari che chi acquisisce quelle lingue 
deve semplicemente imparare, proprio come si impara il 
vocabolario - sulla base della buona vecchia induzione. 
Come fa notare Hornstein (2009, p. 165): «Se i parametri 
vengono enunciati a livello lessicale (la visione corrente), 
allora le differenze di parametro si riducono a questo: se 
una data lingua contenga o meno un certo elemento 
lessicale ... L'impostazione dei parametri non è diversa da 
un approccio basato sulle regole». 

La posizione di Hornstein (2009) suggerisce che almeno 
qualche generativista tra quelli più in auge si sta muovendo 
in una direzione simile a quella proposta da questo libro. 
Anche lui propone una GU radicalmente ridotta (sebbene la 
riduzione avvenga seguendo linee differenti da quelle 


seguite qui) e si domanda «se i DLP [Dati Linguistici 
Primari] siano sufficienti affinché il DAL [Dispositivo di 
Acquisizione della Lingua] costruisca una grammatica, 
essendo dati soltanto le operazioni invarianti di base e i 
princìpi per la loro costruzione» (p. 167). Questa è una 
domanda alla quale ogni teoria secondo cui la sintassi è 
solo parzialmente innata deve rispondere in maniera 
affermativa, se vuole essere accettata. 


7 
L«ACQUISIZIONE» DELLA LINGUA 


C’e una cosa (forse l’unica) sulla quale concordano 
praticamente tutti coloro che scrivono di acquisizione della 
lingua da parte dei bambini: all’inizio ci sono un bambino A 
e una lingua B; A non possiede ancora B e (in maniera 
cosciente o non cosciente) punta ad acquisirla, compiendo 
un certo sforzo mirato a raggiungere questo obiettivo. A 
seconda delle specifiche propensioni teoriche di ciascuno, 
questo sforzo è (o non è) supportato dalla conoscenza 
inconscia interna ad A; ma, in ogni caso, si tratta di 
qualcosa che può essere caratterizzato al meglio tramite i 
termini apprendimento o acquisizione e può essere trattato 
come un compito e non come un insieme di reazioni 
automatiche. 

Certo, Chomsky ha parlato spesso di «crescita» del 
linguaggio e l’ha paragonata alla crescita degli organi fisici, 
come le braccia e le gambe: «Si dovrebbe chiamare 
crescita lo sviluppo del linguaggio perché l’organo del 
linguaggio cresce, proprio come fa ogni altro organo» 
(Chomsky 1983), e di conseguenza «L'apprendimento della 
lingua non è proprio qualcosa che un bambino compie; è 
qualcosa che a un bambino ... capita» (Chomsky 1988, p. 
134 [trad. it. p. 118]). Eppure, nel corso degli anni, egli ha 
mostrato una notevole ambivalenza circa la natura 
dell’acquisizione. Mentre affermava cose di questo tipo, 
andava elaborando la nozione di Dispositivo di Acquisizione 
della Lingua (DAL), che richiedeva delle assunzioni non 
diverse da quelle fatte dagli altri modelli. 

La relazione tra il DAL, la GU e la «conoscenza del 
linguaggio» discussa nel capitolo 2 assomiglia abbastanza 


alla relazione che, secondo la teologia cristiana, 
contraddistingue la Trinità: a volte sembrano cose distinte, 
ma sono in realtà aspetti di una sola entità. Il DAL, in 
quanto deposito della «conoscenza del linguaggio», 
fornisce al bambino un insieme di ipotesi su tutte le lingue 
possibili; queste ipotesi possono essere testate sulla base 
dei dati linguistici primari, mettendo così il bambino nella 
condizione di identificare il sistema grammaticale della 
lingua locale (Chomsky 1965, 1972). Introducendo il 
modello della GU in termini di princìpi e parametri, 
Chomsky afferma che, per quanto riguarda «la teoria 
dell’acquisizione della lingua, assumiamo che il bambino si 
avvicini a questo compito già equipaggiato della GU» 
(Chomsky 1981, p. 8, corsivo mio). Difficilmente la 
«Crescita» può essere descritta come un «compito» - di 
sicuro, non può essere descritta come un compito che 
richieda un equipaggiamento altamente specializzato. 

Tra le altre cose, il DAL conteneva un insieme di 
parametri i cui valori dovevano essere impostati dal 
bambino, idealmente limitandosi a scegliere tra due 
impostazioni preordinate. Perciò «una teoria esplicativa 
[dell’acquisizione della lingua] dovrebbe specificare come 
sono impostati i parametri da parte di chi apprende ... sulla 
base dei dati rilevanti ricevuti» (Dresher 1999, p. 27). 
Normalmente, si è pensato che questo fosse un singolo 
processo di natura seriale: il bambino restringerebbe il 
cerchio, per così dire, arrivando alla grammatica corretta 
sulla base dell’eliminazione progressiva delle possibili 
alternative. Ma è compatibile anche un punto di vista 
diverso: se le grammatiche sono tutte potenzialmente 
disponibili per il bambino (come dovrebbe essere, se è vero 
che le grammatiche delle oltre seimila lingue devono essere 
tutte ugualmente accessibili, e come si è implicitamente 
assunto per tutta la storia del DAL), allora potrebbe essere 
che vengano prese in considerazione due (o più) 
grammatiche contemporaneamente. Ciascuna sarebbe in 


competizione con l’altra, acquisendo punti ogniqualvolta 
coincidesse con i dati primari, finché l’una o l’altra non 
vinca e i bambini finalmente stabiliscano che la lingua che 
stanno acquisendo è l’inglese e non il cinese, o viceversa 
(Yang 2002). 

L'idea, all'apparenza di buon senso, che la lingua sia «la 
fuori» e che il bambino abbia in qualche modo il «compito 
di apprenderla» viene espressa con ancor più forza da chi 
non accetta che ci sia una qualche forma di supporto innato 
dedicato in maniera specifica all’assolvimento di questo 
compito. A un’estremità dello spettro delle posizioni 
empiriste troviamo quanti sostengono una posizione 
«innatista generale» di un qualche tipo - ci possono essere 
dei processi innati, che però, a differenza del DAL, non 
sono dedicati specificamente al linguaggio -, e quanti 
credono che l’acquisizione rimanga «un processo di 
formazione e messa alla prova delle ipotesi» (O’Grady 
1987, p. 173). All’altra estremità, troviamo coloro che sono 
disposti ad accettare che i bambini abbiano «delle 
rappresentazioni linguistiche soggiacenti», ma sostengono 
che queste consistano di «schemi basati su elementi 
singoli» piuttosto che di «“regole” linguistiche più astratte» 
(Tomasello 2001, p. 67); e perciò devono essere apprese 
come ogni altro genere di abilità o conoscenza: per 
induzione a partire dai dati primari coadiuvati dal 
ragionamento per generalizzazione e analogico. 

Anche laddove il linguaggio venga visto come una 
qualche forma di idea platonica - qualcosa che viene 
scoperto, e non qualcosa che si è evoluto o è stato 
inventato -, pare che al bambino non basti il semplice fatto 
di riscoprirlo o rimetterlo in funzione. «Lidea del 
linguaggio come oggetto astratto non cambia l’idea di come 
esso possa essere stato appreso, e cioè a partire dalla sua 
architettura formale attuale. In ognuno dei due casi, la 
formazione delle ipotesi e la loro verifica resta un modello 
possibile» (Bever 2009, p. 231). Ci si sarebbe potuti 


aspettare che anche il Programma Minimalista modificasse 
in qualche misura l’approccio generativista all’acquisizione. 
Sorprendentemente, invece, non è stato così (Longa e 
Lorenzo 2008). Come molte delle questioni che i 
minimalisti non hanno ancora affrontato in maniera 
soddisfacente, l'acquisizione viene tipicamente scaricata 
sulle «interfacce» - i requisiti del sistema sensomotorio (si 
legga fonologico) e del sistema concettuale-intenzionale (si 
legga semantico), il meccanismo di collegamento dei quali 
attualmente si ritiene sia la sintassi: «Le questioni di 
acquisizione della lingua ... anche al giorno d’oggi si 
riducono presumibilmente a questioni legate 
all'interfaccia» (Larson et al. 2010, p. 4, corsivo mio). Come 
esattamente tali questioni vengano «ridotte» e che cosa 
faccia il bambino in simili casi - come il suo comportamento 
sia diverso (se lo è) da quello previsto nei modelli 
precedenti - resta un territorio inesplorato. 


UN’ALTERNATIVA AL CONSENSO 


Cosa potremmo dire, se prendessimo sul serio l’idea di 
Chomsky che il linguaggio cresce nel bambino? Un'idea di 
questo tipo va chiaramente nella stessa direzione del 
resoconto che sto presentando. Ho sostenuto qui che il 
nucleo del linguaggio è un piccolo insieme di algoritmi 
(forse composto da non più di due o tre membri) che 
creano in automatico le strutture di base e rimangono 
invariati attraverso le diverse lingue. Tale meccanismo 
basta per generare una lingua umana completa, per quanto 
ridotta al minimo e abbastanza scarna, se messa a 
confronto con qualsiasi lingua realmente esistente. Dal 
momento che è un elemento invariante, e non qualcosa che 
aspiri a essere una ricetta per costruire una delle molteplici 
lingue del mondo, il meccanismo non richiede che il 
bambino esegua alcuna operazione cognitiva su di esso o 


con esso. Anzi, il bambino si comporta esattamente come il 
ragno, il castoro o il pipistrello: il programma biologico che 
sovraintende a ciò che la specie fa meglio semplicemente si 
mette in moto da solo, quando viene stimolato dalle parole 
pronunciate nell'ambiente circostante. 

All’inizio, i bambini apprendono le parole. Non tentano di 
determinare la natura complessiva dell’input che ricevono. 
Possono non avere idea del fatto che stiano imparando 
l'inglese, lo yoruba o il giapponese. Per il momento, tutto 
quello che fanno è acquisire delle parole che poi useranno 
per comunicare con chi gli sta attorno. Una volta che 
abbiano trovato due parole che possono combinare per dire 
qualcosa che vogliano dire, le combineranno. Gli algoritmi 
sono innati, ma non possono ancora  impiegarli, 
semplicemente perché non conoscono ancora abbastanza 
parole per poter soddisfare i requisiti degli algoritmi - 
ipotizziamo che non ci sia nessun tipo di ritardo nello 
sviluppo. Prendete l'algoritmo per formare le clausole: 
combina un verbo e tutti i suoi argomenti 
sottocategorizzati. I verbi sono più difficili da acquisire 
rispetto ai nomi, e imparare un verbo non garantisce che si 
impareranno immediatamente anche i nomi che con esso si 
possono combinare per formare qualcosa che il bambino 
potrebbe voler dire. Ci vorranno dei mesi prima che i 
bambini riempiano l’intelaiatura anche della più semplice 
struttura argomentale (quella con un singolo argomento) 
con gli oggetti lessicali propri. Questo però non li 
scoraggia. Non aspettano di aver determinato come la 
lingua che stanno apprendendo gestisca una particolare 
struttura. E perché dovrebbero? Hanno già una lingua. Il 
loro unico problema è questo: sebbene la lingua di cui 
dispongono abbia molto in comune con quella che alla fine 
sarà la loro «lingua-madre», non è comunque la stessa 
lingua. Ma nei primi stadi non si lasciano infastidire da 
questo. All’inizio, probabilmente non notano alcuna 
discrepanza. 


Tuttavia, crescendo, quando iniziano a rendersi conto che 
i membri di una qualsiasi specie sociale devono seguire le 
stesse norme che seguono gli altri, cominciano a notare 
delle discrepanze, come noterebbero qualsiasi altro 
dettame sociale a cui ci si aspetta che si conformino. Solo a 
quel punto cominciano ad autocorreggersi. Ma non lo fanno 
su basi generali o sulla base di princìpi. Correggono una 
forma superficiale sostituendola con un’altra forma 
superficiale. Dapprima lo fanno caso per caso. Serviranno 
alcuni mesi prima che inizino a generalizzare - per 
esempio, se stanno imparando l’inglese, seguendo la regola 
che forma i tempi passati aggiungendo -ed ai verbi e i 
plurali aggiungendo -s ai nomi. Questa procedura - che 
rispetta una ricetta innata aggiustandola per accordarsi ai 
dati primari, quando sia obbligata a farlo, per poi 
archiviare i risultati e usarli in seguito - prosegue finché le 
revisioni archiviate al programma originale non diventano 
una grammatica completa della lingua che stanno 
imparando (o una qualche sua variante), qualunque essa 
sia. 

I paragrafi seguenti di questo capitolo passeranno in 
rassegna il ciclo dello sviluppo del linguaggio nel bambino 
ed esamineranno come le tesi di questo approccio 
alternativo influenzino ogni fase di quel ciclo. Ma, prima di 
discutere le singole fasi, dovremmo affrontare un problema 
più generale: se le prime fasi del linguaggio infantile 
possano essere legittimamente viste come una forma di 
proto-linguaggio. 


IL LINGUAGGIO INFANTILE 
E UN PROTO-LINGUAGGIO? 


Una tesi molto discussa del modello che presentavo in 
Bickerton (1990b, 1995) era che il linguaggio infantile 
potesse essere una forma di proto-linguaggio. Le critiche 
più puntuali sono state mosse da Slobin (2004) e Mufwene 


(2008); mi auguro che rispondere a loro chiarira alcune 
questioni su cui le trattazioni precedenti possono essere 
state non sufficientemente chiare e addirittura scorrette in 
un aspetto. 

Mufwene (2008, p. 272) non trova «nessun parallelo 
concepibile tra il cervello dei primi ominidi e le menti che 
hanno prodotto i proto-linguaggi postulati da Bickerton 
(1990b, 2000) e Givòn (1998), da una parte, e quelli dei 
moderni adulti che hanno prodotto dei pidgin (incipienti) e 
dei moderni bambini che producono il linguaggio infantile, 
dall’altra». Questa affermazione è corretta, ma non è 
rilevante. Il termine «proto-linguaggio» astrae 
deliberatamente dalla natura particolare del cervello e 
della mente di chi lo produce, che sono naturalmente molto 
diversi. Lo fa per dare una descrizione puramente formale 
di un sistema (o forse sarebbe meglio dire della «mancanza 
di un sistema») e per caratterizzare un mezzo che è diverso 
sia dalla comunicazione tra animali sia dal linguaggio vero 
e proprio, pur essendo plausibilmente, proprio per questo, 
uno stadio intermedio tra i due. A quanto mi risulta, esso 
non ha seri rivali con cui è in competizione per occupare 
questa posizione intermedia - eppure, un qualche 
intermediario deve esserci stato, a meno che non si voglia 
teorizzare un salto diretto da uno stato non linguistico alla 
ricchezza del linguaggio moderno. 

Un'altra ragione importante a favore dell’esistenza del 
proto-linguaggio, e della sua natura di proto-linguaggio, è 
un fattore che accomuna tutti coloro che lo producono, al di 
là delle differenze che li dividono: la carenza di parole. 
Senza un vocabolario adeguato, non può svilupparsi nulla 
che assomigli alla sintassi del linguaggio naturale. I 
protoumani non avevano abbastanza parole perché non ne 
avevano ancora inventate a sufficienza; le scimmie 
addestrate non hanno abbastanza parole perché i loro 
addestratori non gliene hanno insegnate a sufficienza; i 
parlanti di pidgin non hanno abbastanza parole perché le 


circostanze sociali nelle quali si sviluppano i pidgin non 
permettono loro di impararne a sufficienza; i bambini 
piccoli non hanno abbastanza parole perché non hanno 
ancora avuto il tempo di impararne a sufficienza. 

Concediamo che nei primi due casi ci siano delle ragioni 
ulteriori che rendono impossibile un linguaggio vero e 
proprio. I protoumani non hanno avuto il tempo necessario 
(almeno centinaia di migliaia di anni) per sviluppare 
un’infrastruttura neurale adeguata per la sintassi e le 
scimmie probabilmente non ce l'avranno mai. Al contrario, i 
parlanti di pidgin e i bambini possiedono una tale 
infrastruttura; i primi parlano anche già almeno una lingua 
completa e i secondi la parleranno presto. Ma questo non 
significa che ci sia necessariamente una qualche differenza 
nelle forme dei loro proferimenti. Infatti, nella maggior 
parte dei casi non c’è nulla nella struttura di quei 
proferimenti che, nel contesto di un esperimento in doppio 
cieco, ci permetterebbe di riconoscere se essi siano stati 
prodotti da una scimmia, da un parlante di pidgin adulto o 
da un bambino. Che si verifichi questo, a dispetto delle 
grandi differenze mentali sottolineate da Mufwene (2008) e 
Slobin (2004), è degno di nota e senza dubbio è un dato 
significativo di per sé. 

Slobin (2004) è in disaccordo anche per ragioni più 
specifiche e a livello formale. Secondo lui, le caratteristiche 
del linguaggio infantile sono, anche nei primi stadi, troppo 
ricche e complesse perché possa valere la definizione di 
proto-linguaggio. Egli fa notare che i proferimenti dei 
bambini che stanno imparando una lingua agglutinante 
come il turco o una lingua polisintetica come l’inuktitut 
saranno molto diversi da quelli dei bambini che stanno 
imparando una lingua isolante come l'inglese: «I bambini 
sotto i due anni che sono esposti a queste lingue non 
mostrano nessuno dei segni della parlata 
“pregrammaticale” del tipo descritto da Bickerton, Givòn e 
altri, come l’assenza di una morfologia grammaticale e 


l’affidarsi a un ordine delle parole tema-rema. I bambini 
turchi mostrano un uso produttivo delle flessioni dei casi 
per i nomi già a soli quindici mesi - cioè una morfologia 
produttiva a livello della singola parola» (p. 257). 

Essendo la tipologia delle lingue in questione quella che 
è, sarebbe sorprendente se le cose non stessero così. Le 
parole dell’inglese tipicamente compaiono nelle loro radici 
pure (o forme di citazione) - il che non sorprende, perché 
quella lingua ha poco più di una dozzina di morfemi 
grammaticali legati. Le radici pure delle parole nelle lingue 
come il turco o l’inuktitut compaiono raramente (se non 
mai); nella maggior parte dei casi (se non in tutti), sono 
accompagnate da un qualche tipo di flessione. Prendete 
questa frase citata da Slobin (2004): 


1. kazag-im-i at-ti-m. 
felpa-mia-ACCUSATIVO buttare-PASSATO-PRIMA 
PERSONA. 
«Ho buttato la mia felpa». 


(1) è stata proferita da un bambino turco di diciotto mesi. 
Un bambino inglese della stessa eta avrebbe probabilmente 
detto throw sweater («gettare felpa»). Ma sarebbe stato 
ben al di la delle capacita persino di un piccolo Chomsky 
dire kazak atmak - l’equivalente più vicino possibile in 
turco di throw sweater -, dal momento che il bambino avrà 
sentito raramente (per non dire mai) queste forme. Per 
dirla in altri termini, i bambini che stanno imparando una 
lingua polisintetica o agglutinante non hanno altre opzioni 
se non quella di produrre delle parole con più morfemi 
praticamente fin dall’inizio, perché queste sono le sole 
parole che sentono con una frequenza sufficiente per 
poterle imparare. 

Si noti che la tesi di Slobin (2004) non è che, all’inizio o in 
ogni circostanza, i bambini turchi usino delle parole 
polimorfemiche in maniera così corretta come in (1). 


McWhinney (1976, p. 398), scrivendo di acquisizione 
dell’ungherese, una lingua agglutinante che presenta molte 
somiglianze strutturali con il turco, fa notare che «gli errori 
di segmentazione della parola sono piuttosto rari per i 
bambini ungheresi», ma che «quegli errori di 
segmentazione della parola che effettivamente vengono 
fatti riguardano la separazione di un morfema dall’altro 
all’interno di una parola». McWhinney fa notare poi che tali 
errori rivelano spesso delle analisi semantiche incomplete 
di parole composte. In altri termini, i bambini che parlano 
ungherese e quelli che parlano turco stanno semplicemente 
«imparando le parole» proprio come i bambini che parlano 
inglese. Le parole non portano delle etichette che dicono se 
siano o meno polimorfemiche in modo che i bambini 
possano saperlo prima. Non possono analizzare le parole 
nelle loro parti componenti, o anche solo sapere che le 
parole hanno delle parti componenti, finché non hanno 
incontrato contrasti come quello tra «felpa-mia- 
ACCUSATIVO» e «felpa-mia-NOMINATIVO» o «felpa-tua- 
ACCUSATIVO». Di conseguenza, (1) e frasi del genere non 
costituiscono, di per sé, un’evidenza sufficiente per poter 
parlare di una piena padronanza e comprensione delle 
parole flesse in essi contenute. 

Nonostante ciò, la mia convinzione ora è che il linguaggio 
infantile, a differenza di certi stadi di pidgin (a cui ci si 
riferisce talvolta con «gergo» per distinguerli da quei 
pidgin che sono ormai costituiti, regolarizzati e diventano 
via via più complessi), non sia una vera e propria forma di 
proto-linguaggio. Adottare quella posizione comporta che si 
assuma la visione secondo cui la componente innata, per 
qualche ragione, non sia disponibile durante i primi due 
anni di vita del bambino (o giù di lì). Poi, a seguito della 
maturazione o della rimozione di un qualche collo di 
bottiglia nello sviluppo, la sintassi comincia per così dire a 
operare, e il bambino passa senza problemi dal proto- 
linguaggio al linguaggio. 


Che cosa c’è di sbagliato in questa posizione? Il fatto che 
apparentemente esista un collo di bottiglia attivo fino al 
terzo anno di vita del bambino è stato notato spesso in 
letteratura (Bloom 1970; Brown 1973; Pinker 1984; Crain e 
Lillo-Martin 1999), sebbene i tentativi di spiegarlo siano 
relativamente pochi. Che la componente innata diventi più 
matura con il tempo è stato suggerito su basi diverse da 
vari autori, inclusi Radford (1986, 1990) e Wexler (1998; 
Borer e Wexler 1987). Tuttavia l’ipotesi della maturazione 
si trova in opposizione rispetto a un’altra posizione più 
diffusa: l'ipotesi della continuità (Hyams 1986; Boser et al. 
1992; Lust 1986). 

Secondo l’ipotesi della continuità, la componente innata è 
lo stato iniziale del bambino; in altre parole, il bambino ha 
potenzialmente a disposizione la GU fin dalla sua nascita 
(Lust 1999, p. 118). Forse l’argomentazione più forte a 
favore della teoria della continuità è questa: «Non c’è nulla 
nella teoria della GU che spieghi come e perché essa 
dovrebbe essere così frammentata [come sostiene l’ipotesi 
della maturazione] ... o perché le sue parti siano ordinate 
nel modo in cui sono ordinate» (p. 125). Largomentazione 
più forte contro l'ipotesi della continuità è che, se è vera, 
«il bambino ha sia un insieme fisso di abilità linguistiche sia 
una lingua che si sta sviluppando. L'unico modo per 
spiegare questa congiunzione è assumere che vengano 
appresi dei nuovi pezzi di linguaggio ... L'ipotesi della 
maturazione rende possibile una teoria dell’innatezza più 
forte di quanto non faccia l’ipotesi della continuità» (Borer 
e Wexler 1987, p. 125). 

Largomentazione di Borer e Wexler (1987) è molto 
potente, se usata contro le interpretazioni standard della 
GU, le quali sostengono che la grammatica di ogni lingua 
(eccezion fatta per una mai meglio definita «periferia» di 
eccezioni idiosincratiche) possa essere interamente 
derivata dalla GU. In effetti, di primo acchito, l'ipotesi della 
maturazione sembra più compatibile con i dati empirici 


rispetto all’ipotesi della continuita; quest’ultima deve infatti 
sostenere che i ritardi nello sviluppo che hanno portato alla 
formulazione dell’ipotesi della maturazione siano, in realta, 
dovuti alla complessita per il bambino del compito di 
stabilire una corrispondenza tra la GU e i dati linguistici 
grezzi ricevuti. Fare questo, secondo Lust (1999, p. 142), 
«richiede tempo». Tempo, sicuramente - ma diversi anni? 

Come tutto questo suggerisce, sia l’ipotesi della 
maturazione sia l’ipotesi della continuità possono 
infliggersi a vicenda dei colpi molto pesanti, se assumiamo 
una visione standard della GU. Tuttavia le parole di Borer e 
Wexler (1987) citate prima mostrano senza volerlo quanto 
l'ipotesi della continuità si adatti bene a una visione della 
GU come grammatica parziale o ridotta all’osso. Se la 
sintassi è in parte innata e in parte appresa, il fatto che 
l'ipotesi della maturazione «renda possibile una teoria 
dell’innatezza più forte» rispetto alla teoria della continuità 
è un punto a sfavore dell’ipotesi della maturazione e non a 
suo favore. L'obiettivo delle ipotesi sull’acquisizione della 
lingua non dovrebbe essere quello di mettere a punto delle 
teorie dell’innatezza (o altro) più forti, ma piuttosto quello 
di mettere a punto delle teorie sulla GU e sull’acquisizione 
che permettano di raggiungere una corrispondenza 
migliore tra queste due e ciò che sappiamo sulla 
neurobiologia e sull'evoluzione biologica, rimanendo al 
contempo coerenti con il corso dello sviluppo del 
linguaggio osservato nei bambini. Quello che Borer e 
Wexler vedono come un vizio, il mio approccio lo vede come 
una virtù. Secondo tale approccio, il bambino ha «un 
insieme fisso di abilità linguistiche» e, allo stesso tempo, 
«una lingua che si sta sviluppando». Di conseguenza, 
proprio come sostengono Borer e Wexler, dei «nuovi pezzi 
di linguaggio» (quelli che non discendono automaticamente 
dall’insieme fisso di abilità) devono in effetti essere 
«appresi», il che è precisamente quanto assume l’approccio 
che sto proponendo. 


Inoltre, questo approccio ha almeno un vantaggio rispetto 
a tutti gli altri. La teoria della maturazione puo spiegare i 
ritardi nello sviluppo solo ipotizzando dei ritardi nella 
maturazione di particolari componenti della sintassi. Ma 
l’unica motivazione per sostenere questa ipotesi sono gli 
stessi ritardi nell’apprendimento - il ragionamento è quindi 
circolare. La teoria della continuità ha dato una ragione per 
quei ritardi (la quantità di tempo che serve a un bambino, 
anche se aiutato dalla GU, per far corrispondere i dati 
primari e la grammatica della lingua che sta apprendendo); 
ma questa spiegazione non era particolarmente plausibile e 
non dava nessuna ragione estrinseca del perché quel 
processo dovesse essere così lungo o del perché i suoi stadi 
dovessero seguire il decorso che invariabilmente seguono. 
La vera spiegazione dei ritardi sta nella natura delle parole 
acquisite, nel numero delle parole acquisite e nell'ordine in 
cui esse sono acquisite. Nei prossimi paragrafi, dove 
passeremo in rassegna ciascuna delle fasi dello sviluppo, i 
lettori avranno modo di vedere come questi fattori e le loro 
reciproche interazioni entrino in gioco nel processo di 
acquisizione e come essi spieghino il corso che 
quell’acquisizione prende nei primissimi anni di vita del 
bambino. 

Quando considereremo i primi stadi, vedremo che il 
parlato dei bambini ha le stesse sembianze di un proto- 
linguaggio. Ma i preumani e le scimmie non possiedono 
nessuna grammatica innata; i parlanti di pidgin, essendo 
adulti, ne hanno sì una, ma non gli è molto utile, dal 
momento che quello che ora sono costretti ad acquisire non 
ha alcuna grammatica - e (non essendo più dei bambini) 
non hanno più libero accesso ai meccanismi che gli 
avrebbero consentito di trasformare degli input privi di 
struttura in output strutturati. I bambini, invece, ce 
l'hanno, aspettano soltanto di avere abbastanza parole per 
metterli in atto. 


LA FASE DELLA PAROLA SINGOLA 


Ricordiamo le assunzioni di base che stiamo facendo qui. 
Il bambino non «apprende» o «acquisisce» la lingua, ma 
piuttosto la produce, proprio come i pipistrelli non 
«apprendono» o «acquisiscono» l’ecolocazione e i castori 
non «apprendono» o «acquisiscono» la capacità di costruire 
dighe. I castori costruiscono dighe come reazione 
automatica al suono del flusso di una corrente d’acqua 
(Richard 1983; ma si veda anche Zurowski 1992). I bambini 
producono la lingua come reazione automatica al suono di 
un flusso di parole, dal quale sono bombardati 
costantemente dopo la nascita (e anche prima). Imparano 
le parole perché esse sono essenziali per le loro vite future 
come membri di una specie sociale che parla. Mettono 
insieme quelle parole perché sono programmati per farlo 
dai processi discussi nel capitolo 5. 

Ignorerò la primissima fase dello sviluppo del linguaggio, 
la lallazione, poiché riguarda solo la fonologia. Ignorerò 
anche una fase, osservata da Peters (1983) ma tralasciata 
dalla maggior parte degli altri studi, in cui i bambini 
sembrano tentare di produrre delle frasi: quei proferimenti 
hanno la stessa prosodia delle frasi, ma pochi di essi (se 
non nessuno) contengono delle parole riconoscibili. 
Occorre, comunque, studiare più a fondo questa seconda 
fase per determinare se il bambino stia semplicemente 
imitando i modelli che gli vengono offerti da chi si prende 
cura di lui oppure se almeno alcuni dei suoi proferimenti 
siano originali. Nel secondo caso, ci sarebbe ulteriore 
evidenza a favore dell’ipotesi «pronto o no, io arrivo» che 
sto presentando qui. Di conseguenza, per gli scopi di 
questo libro, la prima fase dello sviluppo è quella «della 
parola singola». 

In tutte le lingue c’è un periodo in cui le parole vengono 
prodotte in isolamento, sebbene spesso esse saranno 
seguite, dopo un breve intervallo di tempo, da altre parole 


a loro connesse da un punto di vista semantico o 
pragmatico (Scollon 1976). A prima vista, tutto questo 
sembra far propendere per l’esistenza effettiva di una 
qualche forma di collo di bottiglia sintattico. Tuttavia, 
seguendo le analisi spettrografiche di Branigan (1979) 
condotte sia sulle parole in successione sia su quelle 
concatenate, Carranza et al. (1991) suggeriscono che una 
ragione plausibile sia quella di evitare le complicazioni 
fonologiche che sorgono quando due parole sono 
concatenate. 

Un fattore che viene preso in considerazione raramente è 
la carenza assoluta di vocabolario. Le prime parole sono 
poche e vengono acquisite in maniera molto graduale 
nell’arco di diversi mesi. Il primo vocabolario del bambino è 
tale che, in realtà, ben poche delle parole che esso contiene 
potrebbero essere unite per formare un qualche genere di 
proferimento dotato di senso. Le prime parole mostrano un 
alto grado di uniformità in tutte le lingue. Nella maggior 
parte dei casi, i nomi predominano rispetto alle altre classi 
di parole (Braine 1976; Gentner 1982), e in particolare 
quelli di un certo tipo: i nomi propri e i nomi comuni con 
referenti concreti. Tipicamente, questi includono «cibo 
(succo, biscotti), parti del corpo (occhi, naso), indumenti 
(pannolino, calza), veicoli (auto, barca), elementi della casa 
(bottiglia, luce), animali (cane, micio) e persone (papi, 
bimbo)» (Pinker 1995, p. 142). Forse, l’altra categoria più 
comune non è una classe di parole vere e proprie, ma nomi 
per circostanze consuete ed eventi che si ripetono di 
frequente: finito, cucù, pipì, ciao, oh-oh, ops. (Si noti che 
molte di queste sono esclamazioni che a nessuna età i 
parlanti riuscirebbero a inserire all’interno di strutture 
sintattiche). I verbi e gli aggettivi sono estremamente rari. 
Nel parlato di un bambino (Ted) riportato da Gentner 
(1982), tra le prime sedici parole apprese (in un periodo di 
dieci mesi) non comparivano verbi veri e propri; gli oggetti 
più simili a dei verbi erano un participio passato, bloccato, 


e preposizioni come su e giù, le quali fungevano da 
abbreviazione per (tirami) su e (mettimi) giù. C'erano solo 
due aggettivi, felice e caldo, ma ben quarantuno nomi. 

Da tutto ciò emerge come molte delle combinazioni 
teoricamente possibili sulla base di questa lista di parole 
(per esempio, succo di calza, naso felice, ops cucù, ecc.) 
sarebbero o prive di significato oppure non sarebbero il 
tipo di cose che, ragionevolmente, ci si potrebbe aspettare 
che un bambino sotto i due anni intenda dire. In mancanza 
di una chiara motivazione per determinare l’uso di una 
singola parola o di due parole, l'ipotesi nulla dovrebbe 
essere questa: non appena i bambini apprendono delle 
parole che possono mettere insieme in maniera sensata, lo 
fanno. In concreto, se il soggetto di Gentner (1982), Ted, 
non ha mai detto calza su o su calza quando una delle sue 
calze cadeva per terra, questo molto probabilmente 
accadeva in quanto non era interessato a recuperare la 
calza e non perché non fosse in grado di concatenare calza 
e su. Questa ipotesi dovrebbe essere relativamente facile 
da testare: basta far cadere delle calze per terra (o 
eseguire qualsiasi altra azione che possa innescare il 
proferimento congiunto di una coppia qualsiasi di parole 
che il bambino conosce) e poi osservare la reazione del 
bambino, verbale o di altro tipo. Ma, a quanto ne so, 
nessuno l’ha ancora fatto. 

Almeno tre fattori concorrono a determinare quali parole 
vengano apprese per prime: il riferimento ostensivo, la 
frequenza e la salienza fonologica. I nomi con riferimento 
ostensivo sono quelli il cui significato può essere appreso 
sulla base della presentazione fisica dei loro referenti, con 
o senza l'ausilio di una spiegazione da parte dei genitori - 
si tratta di nomi come libro o lampada e non di nomi come 
paura e misericordia. Questi significati sono molto più 
semplici da afferrare rispetto a quelli dei verbi, i quali, 
anche quando sono concreti come per esempio volare o 
rompere, devono fare generalizzazioni su un’ampia varietà 


di cose che volano e che si rompono. Tra i nomi che 
possono essere definiti in maniera ostensiva, quelli che si 
presentano con piu frequenza saranno naturalmente quelli 
che verranno appresi per primi; per esempio, tra le parti 
del corpo, piede era noto a tutti i membri di un campione di 
dodici bambini, mentre ascella non lo era a nessuno di loro 
(Goldin-Meadow et al. 1976). Per quanto riguarda la 
salienza fonologica, nomi e verbi sono più salienti rispetto a 
cose come preposizioni o ausiliari: hanno un’accentazione 
più forte e non subiscono contrazioni o elisioni. 

Si dovrebbe anche tenere a mente che distinguere le 
singole parole all’interno del flusso continuo del parlato 
non è impresa da poco. Ascoltare una registrazione in una 
lingua sconosciuta è un’esperienza istruttiva in questo 
senso, perché quello è esattamente il modo in cui la futura 
lingua all’inizio suona alle orecchie di qualsiasi bambino. 
Un fattore che rende possibile suddividere il parlato in 
parole è l'apprendimento statistico (Saffran et al. 1996; 
Kuhl 2010). Il bambino determina i confini tra le parole 
sulla base della probabilità relativa delle transizioni tra 
suoni: meno è frequente una transizione, tanto più è 
probabile che essa accada tra parole diverse piuttosto che 
all’interno di una medesima parola. Chiaramente, sarà più 
facile computare i confini nel caso delle parole che 
prendono spesso la stessa forma e non subiscono mai il 
genere di cambiamenti associati a contrazioni e altri 
fenomeni simili tipici degli elementi grammaticali e non di 
quelli lessicali (referenziali). 


LA FASE DELLE DUE PAROLE 


La fase della parola singola frequentemente (anche se 
non sempre) dura alcuni mesi. Quella delle due parole è 
decisamente più breve. Il senso comune suggerisce che, 
man mano che il bambino si allontana dalle restrizioni 


imposte dall’infanzia, venga utilizzata una gamma più 
ampia di capacità, emergano sinergie e lo sviluppo acceleri 
di conseguenza. Tuttavia il senso comune non è sempre 
(ma neppure poi tanto spesso) una scienza, e io non sono a 
conoscenza di nessuna proposta davvero convincente sullo 
sviluppo cognitivo che spieghi perché la fase delle due 
parole debba essere più breve della fase della parola 
singola, oppure perché ciascuna di queste due fasi debba 
esistere. I vaghi appelli alle «limitazioni cognitive» o alle 
«fasi dello sviluppo» non sono abbastanza. 

I primi approcci alle fasi iniziali del linguaggio infantile, 
fino agli anni Cinquanta, si basavano sull'idea che il 
bambino apprenda per imitazione, analogia e simili. Questa 
convinzione avrebbe difficilmente potuto sopravvivere a 
uno studio più attento dei dati grezzi. Ma prima che si 
potesse portare avanti un tale studio, Le strutture della 
sintassi aveva già cambiato le carte in tavola. Da quel 
momento in poi, molti ricercatori iniziarono a ritenere che 
il bambino si formasse una «grammatica» di un qualche 
tipo in ogni fase di sviluppo, dalla fase delle due parole in 
avanti. Un tentativo precoce di stilare questa grammatica 
(Brown e Fraser 1964) si limitava a individuare e 
differenziare le combinazioni, selezionando due «classi di 
parole» sulla base della loro occorrenza in prima o in 
seconda posizione all’interno dei proferimenti. Un 
approccio rivale (Braine 1963), la grammatica «a perno», 
riteneva che ci fossero una manciata di parole (più, fuori e 
via) a fungere da «perno» (in grado di apparire come prima 
o seconda parola) e poi un’ampia classe «aperta», della 
quale facevano parte tutte le altre parole (e quindi anche 
nomi e verbi). Questi tentativi, se potevano essere adeguati 
da un punto di vista osservazionale (in verità le 
grammatiche a perno non erano neppure tali), non 
sapevano spiegare in maniera adeguata quello che il 
bambino faceva; inoltre non riuscivano neppure a mettere 
in relazione la fase delle due parole con gli stadi successivi 


- figuriamoci con la forma finale della grammatica degli 
adulti. 

Ricordate che gli algoritmi innati non danno informazioni 
sull’ordine dei costituenti adiacenti. Le parole all’interno di 
un sintagma o di una clausola possono attaccarsi alla 
sinistra o alla destra delle loro teste. Lesperienza è l’unica 
guida in questo caso; eppure, presto negli studi 
comparativi sull’acquisizione condotti su diverse lingue si è 
osservato che raramente i bambini commettono errori 
nell'ordine dei costituenti (Bloom 1970). Si noti che, se in 
una lingua si ha attaccatura a coppie sulla destra, non c’è 
bisogno di nessun altro meccanismo per determinare 
l'ordine delle parole in essa: se a precede b e b precede c, 
allora per la transitività a deve precedere c. Anzi, una volta 
che si sia stabilito quali sono le parole, determinarne 
l'ordine è un compito di gran lunga più semplice, il che 
deve essere un fattore che contribuisce alla differenza di 
durata tra la fase della parola singola e quella delle due 
parole. 

La fase delle due parole serve per stabilire alcune delle 
relazioni più rilevanti a livello di ordine delle parole nella 
lingua che si sta acquisendo: soggetto-verbo, verbo- 
oggetto, aggettivo-nome, e così via - una componente di 
vitale importanza per le operazioni che saranno sviluppate 
nelle fasi successive. Si noti che, come per la fase della 
parola singola, non c’è in linea di principio un limite nel 
bambino che impedisca di produrre dei proferimenti anche 
più lunghi, ma lo sviluppo è ancora ritardato dal 
vocabolario abbastanza ridotto ed è condizionato, in larga 
misura, dalla natura della crescita del vocabolario. 

Sebbene alcuni lavori recenti abbiano espresso dei dubbi 
sulla reale esistenza di una «esplosione lessicale» (Ganger 
e Brent 2004), non c’è dubbio che il ritmo a cui le parole 
vengono apprese aumenti all'avvicinarsi del secondo 
compleanno e continui a passo molto rapido nei due anni 
successivi, o anche oltre. Sono state proposte molte 


spiegazioni di questo fenomeno (si veda Nazzi e Bertoncini 
2003 per un ottimo riassunto). Tuttavia non serve assumere 
il coinvolgimento di un qualche tipo di sviluppo cognitivo 
particolare, visto che la legge di Zipf (Zipf 1935) rende 
conto in maniera adeguata dei fenomeni rilevanti. 

Come abbiamo visto nella sezione precedente, la 
frequenza è uno dei fattori che determinano quali parole 
vengono apprese per prime. La legge di Zipf afferma che la 
frequenza di qualsiasi parola è inversamente proporzionale 
alla sua posizione nella tabella della frequenza (Zipf 1935). 
Ne segue che, a parità di condizioni (e le condizioni non 
sono poi tanto pari, perché la salienza gioca un ruolo 
importante e raramente le parole più comuni sono salienti), 
le parole più comuni saranno quelle apprese per prime. Ma 
la legge di Zipf significa, tra le altre cose, che una 
minoranza di tipologie [types] di parole sarà responsabile 
della maggior parte delle occorrenze concrete [tokens]. Per 
esempio, sebbene un parlante maturo dell’inglese possa 
avere a disposizione un vocabolario di più di cinquantamila 
parole, le duemila parole più comuni forniscono l’80 per 
cento del testo del milione di parole contenuto nel Brown 
Corpus e il 96 per cento del testo del parlato informale 
(Francis e Kucera 1982). 

Di conseguenza, si forma un ciclo di sviluppo lessicale. Le 
prime cinquanta-cento parole (un numero normale per la 
fase della parola singola) sono acquisite molto lentamente. 
Anche se concediamo che la comprensione supera sempre 
la produzione, persino il testo del madrese (il registro 
semplificato utilizzato in molte lingue, ma non in tutte, da 
coloro che si prendono cura del bambino) deve eccedere la 
conoscenza dei bambini in questa fase; gran parte della 
lingua parlata dagli adulti probabilmente suona più o meno 
così alle orecchie del bambino: «No bla bla bla bla cane bla 
bla macchina bla bla». Il bambino può essere in grado di 
capire sulla base del contesto e degli aspetti pragmatici 
generali della situazione che la madre sta dicendo: «No, 


non puoi portare con te il cane sulla macchina». Ma la 
mancanza di salienza gli impedisce di comprendere le 
parole più comuni. Le parole-funzione (gli elementi 
grammaticali) - pronomi, preposizioni e simili - possono 
fungere da segnali strutturali per il bambino un po’ più 
grande; ma dal punto di vista del bambino più piccolo esse 
sono inutili quanto una serie di parole vuote. Perciò il ritmo 
lento della prima fase di acquisizione delle parole è in parte 
causato dal fatto che il bambino deve tirar fuori da un 
pudding fatto di ingredienti misteriosi quelle poche prugne 
che per lui sono dotate di riferimento e di un senso 
definibile in maniera ostensiva. 

Un altro fattore è quello che si potrebbe chiamare 
«isolamento lessicale». Le prime parole rappresentano una 
manciata di significati che non sono necessariamente molto 
connessi l’uno con l’altro. Possedere un vocabolario 
utilizzabile implica invece costruire una rete di parole, un 
insieme di parole parzialmente definibili sulla base delle 
loro reciproche relazioni: un bassotto è un cane, un cane è 
un animale, un animale è vivo, mentre un martello non lo è; 
rosso è ciò che rimane quando si sono raggiunti i confini 
del marrone, dell’arancione e del rosa; e così via. 
L'esistenza di una tale rete di connessioni semantiche è 
trattata da alcuni autori (per esempio, Deacon 1997) come 
un prerequisito per ogni genere di sistema che sia davvero 
simbolico. Sicuramente, è d’aiuto nell’apprendimento delle 
parole: più la rete di significati che si costruisce è densa, 
minori sono i buchi che in essa rimangono e più è facile 
riempirli imparando le parole appropriate sulla base di 
un'esposizione sempre minore, man mano che la rete 
diventa più completa. Ciò è un potente fattore che 
contribuisce al processo noto come «mappatura veloce» 
(Bornstein et al. 1976; Carey e Bartlett 1978; Heibeck e 
Markman 1987), nel quale i bambini, in genere ben dopo la 
fase delle due parole, imparano parole sulla base di una 
sola piccola esposizione. Ma l'apprendimento continuo di 


parole rende anche possibile la piena comprensione di un 
numero di frasi sempre maggiore - non la comprensione 
parziale e largamente pragmatica descritta nel paragrafo 
precedente. E una comprensione piena, a sua volta, rende 
utilizzabili piu parole per i proferimenti verbali dei bambini. 

Per dirla in altri termini, apprendere le parole è un 
processo autocatalitico. L'ingresso nella fase delle due 
parole dipende dall'aver accumulato una certa massa 
critica di parole. La transizione dalla fase delle due parole a 
quella successiva è semplicemente una funzione del rapido 
aumento della crescita del vocabolario che questa massa 
rende possibile; e per questa ragione la fase delle due 
parole è (a meno di seri problemi nello sviluppo) molto più 
breve di quella della parola singola. 

Tuttavia, prima di passare alla prossima fase, può valere 
la pena di dare un'occhiata a un tipo di casi su cui la 
ricerca è incredibilmente scarsa. Come ha fatto notare 
Nelson (1981, p. 215): «Tutti abbiamo avuto modo di 
osservare quei bambini che al loro secondo compleanno 
non hanno ancora parlato e poi, attorno ai 25 mesi, iniziano 
a produrre frasi che sono più o meno equivalenti a quelle 
dei bambini che hanno iniziato a parlare prima». Sono 
questi casi delle esagerazioni o dei miti, come le presunte 
prime parole di Lord Macaulay: «La ringrazio, signora, il 
tormento si è placato sensibilmente»? Se non lo sono (e non 
andrebbe sottovalutata la capacità degli studenti di 
dottorato di trovare casi di bambini del tutto normali che a 
due anni, o più avanti, non hanno ancora parlato e di 
studiarne il comportamento successivo) e se le loro prime 
frasi sono come quelle suggerite da Nelson, questo avrebbe 
conseguenze importanti per gli studi di acquisizione, 
gettando dei dubbi su qualsiasi teoria che comporti l’idea 
della verifica dell’ipotesi o  dell’essenzialita della 
comunicazione e che dia supporto alla tesi che il linguaggio 
cresca automaticamente con l'apprendimento delle parole. 


IL «DISCORSO TELEGRAFICO» 


A quella delle due parole succede la fase 
tradizionalmente definita del «discorso telegrafico» (Brown 
e Fraser 1964), un medium descritto più recentemente 
come caratterizzato da «sequenze di parole combinate in 
sintagmi o frasi, come Imma vole palla, gatto be latte e papi 
lavoro ciao ciao» - anche se, allo stesso tempo, 
«cominciano ad apparire alcune marche di flessione 
grammaticale... e preposizioni semplici (in, su)» (Yule 2010, 
p. 175 [trad. it. p. 208]). Come suggerisce la definizione di 
Yule, la fase del «discorso telegrafico» non ha dei confini 
netti e, come le fasi che la precedono, non è molto di più di 
una comoda etichetta per distinguere degli stadi all’interno 
dello sviluppo continuo della facoltà del linguaggio. 

Se la fase delle due parole si concentrava principalmente 
sulla determinazione di relazioni lineari di coppie di parole, 
la fase telegrafica è concentrata soprattutto su cose come 
le flessioni grammaticali e le preposizioni semplici. Fino a 
questo punto, il bambino che sta acquisendo l'inglese e 
lingue simili ha dovuto fare i conti solo con quelle classi di 
parole di cui la GU si occupa esplicitamente: nomi, verbi e 
loro modificatori. Paradossalmente (e per i parlanti 
dell'inglese anche in maniera controintuitiva), questo fatto 
può rendere lingue come l’inglese e il cinese più difficili da 
acquisire rispetto alle lingue altamente flessive. Nel caso di 
queste ultime, ciò che i bambini ricevono come pappa fin 
dal primo giorno sono dei piccoli pezzettini di quelle parti 
della loro lingua che non sono predeterminate dalla GU - 
cioè quegli aspetti della lingua che sono emersi dopo la 
formazione della GU e che quindi vanno appresi. Queste 
cose sono attaccate alle parole che i bambini devono 
apprendere, il che gli dà un vantaggio di un anno o più sui 
bambini che apprendono delle lingue isolanti poco flessive. 

D'altra parte, in lingue come l’inglese o il cinese, la 
maggior parte delle parole non ha quei pezzetti che, 


essendo brevi, non accentati, con funzione semantica 
minima e soggetti ad alta distorsione fonologica, fluttuano 
in un limbo tra nomi e verbi «spogli» (morfologicamente 
non complessi) facilmente riconoscibili. Non dobbiamo 
meravigliarci, allora, se ci imbattiamo in quello che 
potremmo chiamare l’effetto throw-sweater/ kazagimi attim 
visto sopra (es. 1) - ovvero il fatto che i bambini che stanno 
apprendendo una lingua altamente flessiva mostrino una 
sofisticazione grammaticale maggiore a un’eta inferiore 
rispetto a quelli che stanno apprendendo una lingua 
isolante come l'inglese. 

Tuttavia, anche un bambino che apprende l'inglese deve 
prima o poi affrontare una classe di parole che, dopotutto, 
include gli elementi del vocabolario più comuni nel 
linguaggio. Al crescere del vocabolario, e quando i 
proferimenti più lunghi possono essere compresi meglio, un 
numero sempre maggiore di questi morfemi grammaticali 
viene portato all'attenzione del bambino. Essi presentano 
due problemi distinti. Uno riguarda i loro significati, molti 
dei quali sono altamente specifici per ogni singola lingua (a 
differenza di quelli delle parole dotate di riferimento, le 
quali di solito hanno almeno un nucleo costante attraverso 
le lingue) e sono elusivi in modi che prenderemo in 
considerazione fra poco. Il secondo problema riguarda i 
loro suoni: frequentemente essi assumono forme diverse, in 
ragione di una combinazione di bassa accentazione ed 
elisioni o contrazioni che dipendono dai suoni del 
linguaggio parlato immediatamente precedenti o 
successivi. 

Si può dire poco di interessante sul piano teorico 
riguardo al secondo problema. Il primo è una faccenda 
diversa. Considerate tutte le flessioni, le particelle e le 
«parole-funzione» come un’unica classe: la classe delle 
distinzioni semantiche grammaticizzabili. Queste includono 
(ma non sono ristrette a) cose come il genere, il tempo, il 
caso, il numero, la persona e così via. È una lista finita? 


Quasi certamente lo è - e probabilmente è anche 
abbastanza corta. Alcune distinzioni (per esempio, i 
marcatori di evidenzialità per i verbi) sono relativamente 
rare, mentre altre (per esempio, il plurale per i nomi) sono 
molto comuni. La domanda che sorge è se la categoria 
«distinzione grammaticizzabile» sia in qualche senso nota 
al bambino, il quale può anche cogliere intuitivamente le 
cose che potrebbero essere distinzioni grammaticizzabili e 
quelle che potrebbero non esserlo. 

Il compito dell’acquisizione sarebbe alleggerito di molto 
se esistesse una qualche precognizione di questo tipo, ma 
l'evidenza che abbiamo a nostra disposizione appare 
contrastante. Nelle lingue creole, come si fa notare nel 
capitolo 8, tipi particolari di tempo, aspetto e modo 
appaiono con una frequenza tale da non poter essere 
casuale, anche se il sistema costituito da questi tipi 
differisce da quelli riscontrati nella maggior parte (se non 
in tutte) delle lingue precedenti a quelle creole (Bickerton 
1981). Tuttavia è difficile che una lingua creola abbia un 
passato semplice che abbia come proprio punto di 
riferimento il momento in cui si sta parlando - cosa che 
invece accade nell’inglese parlato dei bambini, anche 
quando la forma scelta per esprimerlo non è la forma 
corretta nella lingua che si sta apprendendo. Seth, il figlio 
di un mio ex studente, a un certo punto sembrava andare 
alla ricerca di un qualche marcatore grammaticale per il 
tempo passato semplice e, dopo aver sperimentato forme 
differenti, per diverse settimane si era attestato su didja 
(che non implicava necessariamente una domanda): 


2. Didja toot. 
«Ho (appena) scoreggiato». 


La cosa più probabile è che dei fattori cognitivi generali 
forniscano una lista di distinzioni comuni che possono (o 
meno) essere grammaticizzate in ogni lingua data. Ogni 


elemento della lista può essere acquisito facilmente sulla 
base dell’evidenza positiva, ma ogni volta che non trovi 
evidenza chiara per una distinzione particolare, il bambino 
applica un'assunzione predefinita. 

Come accade nelle fasi della parola singola e delle due 
parole, la cosiddetta fase del discorso telegrafico non 
corrisponde a nulla di sostanziale nello sviluppo del 
linguaggio, ma riflette semplicemente la crescita del 
vocabolario. Non c’è una fase corrispondente nelle lingue 
polisintetiche. Può essere illuminante considerare il 
significato (e alcune conseguenze) di tutto questo. 

Le lingue polisintetiche e isolanti sono, nelle loro forme 
più pure, solo gli estremi di una distribuzione bimodale 
nella quale molte lingue mischiano elementi di ciascuno dei 
due tipi. Comunque le mescolanze piene capitano di rado, 
perciò, nella maggior parte dei casi, le lingue sono o 
prevalentemente isolanti o prevalentemente polisintetiche. 
In quelle polisintetiche gli elementi grammaticali sono 
incorporati nelle parole, e così il bambino può impiegare la 
seguente procedura di scoperta, almeno in linea di 
principio. Dapprima separa le parti di una parola dotate di 
contenuto lessicale - cioè quelle che si riferiscono a una 
qualche entità o attività nel mondo. Ciò che rimane deve 
avere delle funzioni grammaticali. Controlla quello che 
accade in altre parole e nelle sostituzioni al loro interno per 
determinare quanti elementi grammaticali separati ci siano 
in ciascun caso. Cerca di capire sulla base del contesto qual 
è la funzione di ciascuno. Dato che la forma di un elemento 
grammaticale non varia in maniera troppo impredicibile nei 
diversi contesti, il compito del bambino non è troppo 
spaventosamente difficile. Si tratta infatti solo di una 
variante più circoscritta del compito che tutti i bambini 
affrontano quando si confrontano con ogni lingua: 
scomporre in morfemi singoli il flusso ininterrotto del 
parlato. E quindi può risultare addirittura più semplice 
rispetto a localizzare e identificare degli elementi che 


occorrono in maniera apparentemente casuale in mezzo a 
cose gia note. 

Ad ogni modo, due cose si possono dire con relativa 
certezza. La prima è che le differenze tra le lingue, per 
quanto riguarda la possibilità di essere apprese e le 
conseguenti pressioni a adattarsi, non possono essere 
troppo grandi; altrimenti, parleremmo tutti una lingua 
simile al turco o all’inuktitut. La seconda è che 
l'acquisizione relativamente lenta da parte dei bambini che 
parlano inglese e i problemi che hanno nell’acquisire gli 
elementi grammaticali non possono essere il risultato di 
una qualche forma di collo di bottiglia o ritardo nello 
sviluppo. Né possono essere dovuti alla maturazione di una 
grammatica innata, dal momento che sarebbe assurdo 
supporre che il turco abbia una grammatica che matura più 
in fretta dell'inglese, o viceversa. È la natura della lingua 
appresa, e non un qualche ritmo di sviluppo cognitivo 
regolato internamente, a essere responsabile dei differenti 
schemi di acquisizione. 

Gli schemi di acquisizione in inglese e in turco danno 
ulteriore supporto alla proposta che la grammatica 
contiene delle componenti apprese e delle componenti non 
apprese. Supponete che ci sia una GU universale nel senso 
discusso nel capitolo 2 - cioè una GU in grado di generare 
le grammatiche di tutte le lingue del mondo. Se così fosse, 
non ci sarebbe motivo per cui le stesse funzioni 
grammaticali vengano apprese più velocemente e più 
facilmente in alcune lingue che in altre, o per cui le 
differenze nei modi in cui sono espresse le relazioni 
grammaticali causino tempi di acquisizione differenti in 
lingue diverse. Si noti inoltre che le differenze nel ritmo di 
acquisizione tra lingue diverse occorrono in quelle aree non 
specificate o sotto-specificate del genere di GU descritto 
nel capitolo 5. Se tutte le grammatiche avessero lo stesso 
potenziale, come implica la classica GU/DAL, questi effetti 
non ci sarebbero. I bambini non dovrebbero avere alcuna 


aspettativa sul genere di lingua che stanno per incontrare. 
Tuttavia, nella vita reale si comportano come se avessero 
delle aspettative e, laddove queste vengano frustrate, si 
verificano ritardi nell’acquisizione di particolari strutture. 

I paragrafi seguenti considerano le tre aree che causano 
le difficoltà maggiori per i bambini che apprendono 
l'inglese: la distinzione causativo/non causativo, la 
negazione della frase e la sintassi delle domande. In tutte e 
tre queste aree, l’acquisizione è, per i bambini che 
imparano l'inglese, più lenta rispetto all'acquisizione delle 
stesse aree nelle lingue in cui non ci sono delle distorsioni 
di schemi predetti sulla base della GU - ed è anche più 
lenta rispetto all'acquisizione di ogni altra area della 
grammatica inglese in cui quegli schemi vengono rispettati. 
Le attuali teorie dell’acquisizione non danno una 
spiegazione soddisfacente dei dati esaminati qui. 


LA DISTINZIONE CAUSATIVO/NON CAUSATIVO 


Mentre esistono alcuni verbi inglesi che possono essere 
usati sia in senso causativo sia in senso non causativo (per 
esempio, melt, «sciogliersi/far sciogliere»: the ice melted, 
«il ghiaccio si è sciolto», in opposizione a I melted the ice, 
«ho fatto sciogliere il ghiaccio»; feed, «mangiare/ dare da 
mangiare»: the cows are feeding, «le mucche stanno 
mangiando», in opposizione a she is feeding the cows, «sta 
dando da mangiare alle mucche»), in molti casi i verbi 
richiedono un verbo causativo esterno: make, «fare» (he 
made X do Y, «fece fare Y a X»). In altri casi ci sono coppie 
di verbi (per esempio, teach, «insegnare»; learn, 
«imparare») che sono lo specchio semantico l’uno 
dell'altro: uno essenzialmente causativo, l’altro 
essenzialmente non causativo. Tuttavia molti bambini 
trattano una grande quantità di verbi non causativi come se 
fossero causativi. Bowerman (1974) dà diciassette esempi 


di non causativi usati come causativi dallo stesso bambino, 
e fa una lista di cento esempi presi da altri bambini nei 
quali compaiono trentasei verbi diversi, tutti prodotti prima 
del compimento dei quattro anni. Le frasi (3) e (4), per 
esempio, vengono entrambe dalla figlia di Bowerman prima 
dei tre anni: 


3. Go me around. 
Lett. «vai me in giro» («portami in giro»). 
4. Can you stay this open? 
Lett. «puoi stare questa aperta?» («puoi 
lasciare 
la finestra aperta?»). 


Questo suggerisce che una distinzione rigida tra verbi 
causativi e non causativi non fa parte della grammatica 
innata. E perché mai dovrebbe? L'assenza di condizioni è 
uno dei fattori che caratterizzano il genere di GU che ho in 
mente qui. Nel capitolo 5 abbiamo visto come l’assenza di 
condizioni per quanto riguarda ciò che potrebbe o meno 
costituire un modificatore abbia lasciato aperta la 
possibilità che un verbo ne modifichi un altro e abbia reso 
possibile costruzioni di verbi seriali. Di conseguenza 
sembra probabile che, nei primi stadi del linguaggio 
umano, tutti i verbi potessero potenzialmente essere usati 
in senso causativo o non causativo. Inevitabilmente, 
nell'uso reale, alcuni saranno stati usati in un senso più 
frequentemente di altri, conducendo così a restrizioni del 
loro significato che saranno semplicemente state apprese, 
dal momento che sono qualcosa che si può apprendere. 

Tuttavia i dati per l’acquisizione della distinzione 
causativo /non causativo in inglese sono un problema per 
molte delle tesi esistenti su come funzioni l'acquisizione in 
generale. Prendete, per esempio, la proposta di Baker 
(1979) secondo cui, in mancanza di evidenze apertamente 
contrarie (il fatto che gli venga detto che certe frasi sono 


scorrette), i bambini ipotizzerebbero una regola solo se 
essa viene confermata da un’evidenza positiva; in altre 
parole, non si arrischierebbero a tirare a indovinare una 
regola solo perché negli input ricevuti non c’é nulla che la 
contraddica. Questa proposta è stata raffinata nel 
«principio del sottoinsieme» (Berwick e Weinberg 1984): i 
bambini ipotizzerebbero la regola più restrittiva - in questo 
caso, che un verbo usato in senso non causativo possa 
essere usato solo così - e la manterrebbero finché 
un’evidenza positiva (lo stesso verbo usato in senso 
causativo) non mostri che essa era troppo restrittiva. 

Ma se il principio del sottoinsieme funzionasse sempre, i 
bambini non userebbero mai in senso causativo un verbo 
che hanno appreso come non causativo. Dal momento che 
verbi come go e stay non sono mai usati in senso causativo 
nel parlato degli adulti, il principio del sottoinsieme 
dovrebbe impedire che i bambini producano delle frasi 
come (3) e (4). L'esistenza di verbi come feed o melt, anche 
se ai bambini fosse capitato di incontrare questi verbi usati 
in entrambi i modi, non sarebbe un’evidenza a favore della 
regola meno restrittiva. Indicherebbe semplicemente che 
alcuni verbi incorporano entrambe le proprietà, lasciando 
al bambino il compito di scoprire caso per caso quali siano. 
Gli errori fatti per via di un'estensione eccessiva della 
causatività non si possono mai correggere solo sulla base 
dell’evidenza positiva. 

l'evidenza che emerge dalla distinzione causativo/ non 
causativo è altrettanto pericolosa per le teorie empiriste 
dell’apprendimento. Di recente, l'ipotesi che ci sia un 
«apprendimento degli elementi singoli» ha ricevuto un 
supporto considerevole; essa sostiene che «i primi 
proferimenti dei bambini sono organizzati attorno a parole 
e sintagmi concreti e non attorno a categorie o schemi 
sintattici sistemici» (Tomasello 2000a, p. 156). Per esempio, 
mentre i bambini possono essere in grado di produrre 
proferimenti come la finestra si è rotta, «non possono da 


qui andare avanti e produrre ha rotto la finestra o è stata 
rotta, anche se stanno producendo dei proferimenti 
semplici transitivi e passivi con altri verbi» (Tomasello 
2000b, p. 210). 

Ma se i bambini non possono neppure fare delle 
generalizzazioni che portino a costruzioni legittime, come è 
possibile che producano delle iper-generalizzazioni che 
portano a costruzioni scorrette? Lo stesso Tomasello 
(2000a, p. 158) deve ammettere che i bambini possono 
apprendere i verbi non causativi e poi usarli in senso 
causativo. Egli prova ad aggirare questa evidenza contraria 
sostenendo che i bambini «producono molto poche iper- 
generalizzazioni di questo tipo prima dei tre anni circa» (p. 
158), e cita tre fonti a supporto della propria affermazione 
(Bowerman 1982, 1988; Pinker 1989). Ma tali fonti sono dei 
riassunti generali che passano in rassegna molti fenomeni 
legati al linguaggio infantile; e, mentre fanno alcuni esempi 
tratti da un intervallo d’eta molto ampio, non danno alcuna 
informazione specifica, né fanno alcuna affermazione 
specifica, su quanto presto cominci l’uso degli intransitivi - 
sebbene mostrino che questi errori continuano a essere 
presenti fino ai sei anni, o anche più tardi (esempi in 
Bowerman 1988). Questo accade proprio perché, se non c’è 
una correzione da parte dei genitori, solo l’assenza 
continuata negli input primari di frasi come (3) e (4) per un 
lungo periodo di tempo può, alla fine, convincere il 
bambino ad abbandonare queste espressioni. È significativo 
che Tomasello non citi Bowerman (1974), un articolo che, al 
contrario di quelli da lui indicati, affronta ampiamente ed 
esclusivamente la questione della distinzione causativo/non 
causativo. Dei diciassette errori che riguardano l’uso 
causativo di verbi non causativi fatti dalla figlia di 
Bowerman, non meno di nove sono apparsi prima dei tre 
anni d’età. Questi errori, quindi, non si possono liquidare 
come una qualche strana aberrazione dell’apprendimento 


successivo; e, anche se si potesse farlo, non sarebbe 
comunque chiaro quale differenza farebbe. 

Gli errori che riguardano la distinzione causativo/ non 
causativo supportano la tesi che i bambini non stiano 
facendo il genere di cose che gli studiosi di acquisizione, 
empiristi o innatisti che siano, sostengono che stiano 
facendo. Non stanno imparando a memoria le strutture 
permesse di verbi particolari, non stanno facendo ipotesi 
basate sulla sola evidenza positiva e non stanno 
restringendo le loro ipotesi a un sottoinsieme di ipotesi 
possibili. Stanno andando avanti con le proprie idee su 
quale dovrebbe essere la sintassi della lingua che stanno 
apprendendo, e stanno resistendo in maniera sorprendente 
alle evidenze contrarie. Supportano questa tesi delle 
evidenze provenienti da altre due aree, entrambe tra quelle 
studiate più a fondo in questo campo di ricerca, e molti 
lavori risalgono a più di mezzo secolo fa. Tutti questi studi, 
però, approcciano i problemi a partire da assunzioni 
sull’apprendimento induttiviste oppure generativiste 
ortodosse, perciò anch’essi andranno riesaminati 
attraverso la lente della teoria che sto proponendo. 


LA NEGAZIONE IN FRANCESE E IN INGLESE 


Sono ben documentati i problemi che i bambini che 
parlano inglese hanno con le frasi negative. In parte, quei 
problemi sorgono perché la negazione frasale not 
raramente appare da sola nel discorso spontaneo, ma 
subisce tipicamente una riduzione vocalica a n’t e una 
conseguente combinazione con gli ausiliari, i quali possono 
essi stessi apparire nelle loro forme ridotte. Di 
conseguenza, not si perde in una selva di didn’t, don’t, 
won't, hasn't e aren't, ed è di difficile accesso per il 
bambino. Al contrario, l’esclamativo e la negazione di 


sintagmi nominali no è altamente saliente, comparendo 
spesso in isolamento e con un’accentazione forte. 

La situazione dei bambini che parlano francese è 
piuttosto diversa. Il francese formale ha due negazioni 
frasali, ne e pas, una preverbale e l’altra postverbale. 
Tuttavia la prima viene pronunciata raramente nel francese 
colloquiale, mentre la seconda non è mai ridotta né elisa. 
Inoltre, il francese è una lingua a isocronismo sillabico e 
non a isocronismo accentuale, perciò c’è molta meno 
differenza di salienza tra pas e il verbo che lo accompagna 
di quanta ce ne sia in inglese tra note il suo verbo. 

Questi fatti giocano un ruolo molto significativo nello 
sviluppo della negazione nelle due lingue. Dal momento che 
i parlanti dell'inglese di norma acquisiscono presto no nel 
loro vocabolario (e in genere molto prima di not), 
espressioni come no ball («nessuna palla») quasi 
invariabilmente occorrono già nella fase delle due parole. 
Non sorprende, perciò, che nella fase telegrafica, prima 
che vengano appresi i verbi ausiliari, no all’inizio di una 
frase continui a essere la negazione frasale prescelta. Di 
conseguenza, si hanno frasi come no the sun shining e no I 
see truck (Bellugi 1967). Poco dopo, cominciano ad 
apparire frasi come he no bite you e I no want envelope. 
Dei tre bambini i cui output sono riassunti in Deprez e 
Pierce (1993), uno aveva raggiunto il 50 per cento delle 
negazioni preverbali a due anni e quattro mesi, mentre un 
altro aveva raggiunto il 70 per cento a due anni, sebbene 
no fosse usato più frequentemente di not. È significativo 
che forme identiche di negazione si trovino quasi 
universalmente nelle lingue creole, anche se non appaiono 
in alcuna varietà dell’inglese degli adulti. 

C’è una posizione canonica per i marcatori negativi nella 
GU? Se c’è, da un punto di vista logico dovrebbe essere 
immediatamente prima del predicato, dal momento che 
questi marcatori negano solo il contenuto del predicato, 
non l’esistenza del soggetto. Ma se le cose stanno così, che 


cosa rende conto della primissima fase della negazione pre- 
frasale? O la scelta di metterla prima del predicato non è 
parte della GU oppure no + F è semplicemente 
l’estrapolazione dello schema no + N, tipico della fase delle 
due parole, all’inizio della fase telegrafica. 

La negazione si sviluppa in maniera diversa nei parlanti 
del francese. Prima dei due anni, i bambini che parlano 
francese hanno già un uso consolidato di pas in tutte le 
posizioni corrette: prima degli infiniti e dopo i verbi 
coniugati nei modi finiti. Distinguere tra modi finiti e 
indefiniti è difficile per i bambini che parlano inglese 
perché le forme del presente e dell’infinito sono identiche, 
ad eccezione della terza persona singolare -per esempio, 
break («rompo», «rompi», «rompiamo», «rompete», 
«rompono»), [to] break («rompere»). È, però, molto più 
semplice per i bambini che parlano francese, perché le 
radici del francese (per esempio «roul-»), possono essere 
derivate dall’occorrenza delle forme flesse - roulons, 
roulez, rouler («rotoliamo», «rotolate», «rotolare») - e dal 
fatto che infinito abbia una propria forma. Di 
conseguenza, mentre le forme non standard della 
negazione in inglese persistono ancora nel terzo anno di 
età, esse sono praticamente assenti fin dall’inizio in 
francese. (Pierce 1989 mostra che nei suoi dati le frasi in 
cui pas è erroneamente collocato rispetto al verbo sono 
meno del 3 per cento). 

Abbiamo bisogno di ulteriori assunzioni per rendere conto 
della differenza tra i due schemi di sviluppo? Chi approccia 
questo problema a partire da una prospettiva generativista 
ha proposto delle spiegazioni basate su princìpi astratti e 
processi coperti. Secondo Klima e Bellugi (1966), gli errori 
nel posizionamento della negazione in inglese risultano dal 
fatto che i bambini non riescono ancora ad acquisire la 
trasformazione che abbassa la negazione. Deprez e Pierce 
(1993), d’altra parte, sostengono che le negazioni 
dell'inglese si trovano nella stessa posizione sia nel 


bambino sia nell’adulto; quello che accade è che il bambino 
non riesce a eseguire il movimento che alza il soggetto, 
quello che porterebbe il soggetto sopra il verbo e sopra la 
negazione (e quindi alla loro sinistra). Al contrario, 
attribuiscono la produzione praticamente priva di errori dei 
bambini francesi alla loro acquisizione precoce dello 
spostamento del verbo verso l’alto, obbligatorio per i verbi 
di modo finito (dal momento che, secondo queste 
assunzioni, i verbi devono alzarsi di posizione per essere 
coniugati a un certo tempo), ma vietato per i verbi 
all'infinito (i quali, naturalmente, non hanno mai la 
flessione temporale). 

Che cosa ne deriva, se queste spiegazioni fossero 
corrette? Una risposta sarebbe che il cervello del bambino 
deve in qualche modo rappresentare molto di più delle sole 
parole e delle ricette per assemblare sintagmi e clausole: 
deve rappresentare anche le categorie grammaticali, non 
solo «nomi» e «verbi», ma cose come «soggetto» e 
«tempo». Non solo, deve rappresentare delle strutture 
gerarchiche ad albero che contengono gli spazi vuoti per 
poter consentire i movimenti e le etichette per quelle 
posizioni. Il fatto che nessuna di queste cose sia accessibile 
alla coscienza è, naturalmente, del tutto irrilevante. Ma se 
sia davvero plausibile che i cervelli possiedano questi 
meccanismi è una faccenda completamente diversa, e certo 
è una questione legittima da sollevare. 

Un generativista potrebbe rispondere: «Be’, non 
sappiamo proprio nulla delle rappresentazioni cerebrali». 
Ma questo ormai non è più vero. Sappiamo, per esempio, 
che «la rappresentazione di una parola è per la maggior 
parte realizzata neurobiologicamente in reti corticali con 
una topologia dipendente dalle modalità che sono correlate 
con gli aspetti esterni del significato» (Assadolahi e 
Pulvermuller 2001, p. 311), e che i segnali neuromagnetici 
delle singole parole possono essere rilevati con 
un’accuratezza che va ben al di là del caso (Kellis et al. 


2010). Nulla che si avvicini neppure lontanamente a questo 
livello di comprensione è disponibile per le 
rappresentazioni di categorie astratte e delle strutture che 
dovrebbero esistere se i meccanismi proposti per 
l'acquisizione della negazione (e innumerevoli altre 
proposte simili fatte dai generativisti) dovessero funzionare 
davvero. Infatti, a quanto ne so, mancano persino dei 
resoconti speculativi di come e con che cosa il cervello 
potrebbe costruire le rappresentazioni necessarie. 

Naturalmente, ciò non significa che queste 
rappresentazioni non esistano. È una semplice questione di 
probabilità e delle strategie di ricerca che ne seguono. Una 
normale strategia di ricerca deve cominciare con una 
proposta economica e relativamente ben supportata, e deve 
preservarla per quanto possibile. Se questa risolve il 
problema, allora non va considerata nessun’altra 
alternativa. Solo quando in questo processo si verifica un 
intoppo il ricercatore prova a battere strade alternative. 
Nel caso dell’acquisizione della negazione, una spiegazione 
basata sull’apprendimento delle parole sembra 
perfettamente adeguata. 

Assumete che tutti i bambini sappiano (se in maniera 
innata o sulla base dell’esperienza non è un problema in 
questo caso) che una frase può essere negativa e che 
qualcosa nella frase marcherà questo fatto. I bambini che 
parlano inglese, allora, cercano di identificare un 
marcatore negativo, ma in un primo momento non riescono 
a farlo correttamente, principalmente per ragioni 
fonologiche. Di conseguenza, iniziano scegliendo il 
marcatore sbagliato (no) e mettendolo nel posto sbagliato 
(all’inizio dell’enunciato invece che all’inizio del predicato) 
perché, dopotutto, quello è il posto dove no appare 
tipicamente nel parlato degli adulti. I bambini che parlano 
inglese, non riuscendo a localizzare (o forse nemmeno a 
identificare) alcun marcatore nella posizione «corretta», 
rivedono le proprie assunzioni e cominciano a posizionare il 


no all’inizio del predicato, anche se negli input che 
ricevono non c’é un solo esempio di questo. Continuano 
così finché non cominciano ad acquisire, molto 
probabilmente in maniera frammentata, una stringa di 
negazioni ridotte - aren’t, don’t e così via -, che 
costituiscono l’evidenza sulla base della quale, alla fine, 
verrà desunto il posizionamento corretto della negazione. 

Al contrario, i bambini che parlano francese non hanno di 
questi problemi, poiché hanno a disposizione fin dall’inizio 
un negatore (pas) immediatamente identificabile e le sue 
due posizioni, ciascuna delle quali gli assegna come ambito 
l’intero predicato, sono marcate in maniera chiara - subito 
prima o subito dopo il primo verbo (principale o ausiliare). 
In altri termini, tutto ciò che gli si richiede di fare è 
osservare le posizioni relative delle parole adiacenti e 
adeguarvisi pedissequamente - cioè impostare una 
relazione non specificata dalla GU, la quale determina solo 
le relazioni tra dominante e subordinato sulla base 
dell'ordine di attaccatura. Come abbiamo visto parlando 
della fase delle due parole, prestare attenzione all'ordine 
delle parole è una tra le preoccupazioni principali che 
previene tutti gli errori (eccezion fatta per una piccola 
porzione di essi) nel loro ordinamento anche nelle 
primissime fasi. (È anche uno dei sei «princìpi operanti» 
che Slobin 1973 attribuisce ai bambini che stanno 
imparando la lingua). Inoltre, l’ordine delle parole è l’unica 
evidenza sulla quale i bambini possono fondare 
l'assunzione che i verbi «si spostano verso l'alto». 

Perciò, in entrambe le lingue il procedimento 
dell’acquisizione può essere chiarito dalla spiegazione più 
economica - il bambino impara solo le parole, ha problemi 
a imparare le parole-funzione, ma va avanti comunque, 
usando schemi innati -, meglio di quanto non faccia un 
processo che coinvolge trasformazioni, movimenti coperti o 
qualsiasi altro tipo di apparato astratto. Questo ci consente 
di non ipotizzare dei meccanismi cerebrali che 


rappresentino in qualche modo delle astrazioni di questo 
tipo e per i quali non abbiamo supporto empirico. Questa 
conclusione è rafforzata decisamente dai dati 
sull’acquisizione delle interrogative, che illustrano la 
tenacia con cui i bambini possono resistere all'evidenza 
messa a disposizione dal parlato di chi si occupa di loro, 
quando essa vada contro le loro ricette innate per la 
costruzione della frase. 


ACQUISIRE LE FORME INTERROGATIVE 


In inglese una grande porzione dei proferimenti che gli 
adulti pronunciano ai bambini è rappresentata dalle 
domande: il 33 per cento secondo uno studio (Cross 1977), 
il 44 per cento secondo un altro (Newport et al. 1977). 
Linversione dell’ausiliare e del verbo che caratterizza la 
maggior parte di esse - tanto le cosiddette domande WH 
(quelle in cui compaiono who, what, where, ecc.), quanto 
quelle a cui rispondere sì o no - dovrebbe quindi essere per 
i bambini più familiare di qualsiasi altra costruzione 
dell'inglese. Se i bambini apprendessero in maniera 
induttiva e senza alcuna aspettativa innata, le strutture 
corrette per formulare le domande dovrebbero essere tra le 
prime che apprendono. 

Invece, «le domande sono forse l’unica struttura 
sintattica per la quale i bambini che parlano inglese fanno 
comunemente errori nell’ordine delle parole» (Ambridge et 
al. 2006, p. 520). Infatti servono più di due anni perché 
padroneggino queste strutture (Klima e Bellugi 1966). 
Nella fase delle due parole, le primissime domande sono 
composte tipicamente dalle parole WH più un nome, come 
per esempio where kitty? In seguito le domande vengono 
costruite come delle strutture dichiarative e la loro natura 
interrogativa è rivelata solo dall’intonazione. Questa è la 
struttura usata nelle lingue creole e in lingue come il 


tedesco, nelle quali le domande marcate solo 
dall’intonazione sono un’alternativa legittima all’inversione 
soggetto-ausiliare o all’inversione soggetto-verbo. I 
bambini tedeschi acquisiscono questo schema abbastanza 
presto e senza sforzo, mentre l’inversione soggetto-verbo 
viene acquisita solo molto più tardi (Mills 1985). In kaluli, 
una lingua parlata in Nuova Guinea, un marcatore 
interrogativo invariante per i sintagmi nominali viene 
acquisito intorno ai venticinque mesi, ma le particelle 
interrogative frasali che richiedono una distinzione più 
raffinata della persona nei verbi causano dei problemi 
(Schiefflin 1985). In ebraico, le domande con risposta sì o 
no si formano seguendo l’ordine delle dichiarative e sono 
marcate solo dall’intonazione, mentre le domande WH 
richiedono soltanto che il pronome interrogativo venga 
posto all’inizio di una struttura dichiarativa. Secondo Eyal 
(1976), circa 80 per cento di un campione di bambini 
parlanti dell’ebraico sotto i trenta mesi era in grado di fare 
domande senza errori, mentre i bambini parlanti 
dell'inglese non raggiungevano questo livello fino alla meta 
del quarto anno di vita. 

Si potrebbe supporre che il ritardo nell’acquisizione delle 
forme interrogative in inglese abbia a che fare con un 
ritardo comparabile nell’apprendimento delle forme 
ausiliarie. Infatti queste ultime sono spesso contratte e 
poco accentate, il che le rende delle parole difficili da 
apprendere. Il ritardo nell’apprendimento degli ausiliari 
contribuisce senza dubbio a spiegare la difficoltà 
nell’acquisizione delle domande. Tuttavia non può spiegarla 
interamente, perché nelle domande con risposta sì o no 
appaiono ausiliari tipicamente non contratti e solo 
occasionalmente accentati (Did you pull the doggy’s tail?). 
In questo caso è rilevante l’Ipotesi di Chiarificazione 
dell’Ausiliare (Richards 1990), che suggerisce questo: 
poiché i bambini hanno un bias che li porta a prestare più 
attenzione all’inizio delle frasi, gli ausiliari sono elaborati 


più prontamente e vengono appresi più facilmente quando 
compaiono all’interno di domande. Se fosse così, la 
predizione che dovremmo fare è che un aumento nella 
frequenza degli ausiliari nel linguaggio parlato di coloro 
che si occupano dei bambini faciliterebbe l’acquisizione 
delle forme interrogative corrette. Tuttavia, in uno studio 
che passa in rassegna la letteratura e conduce anche dei 
test sperimentali (Fey e Loeb 2002), gli autori hanno 
riscontrato che un aumento nell'uso degli ausiliari 
all’interno delle domande da parte di chi si occupava dei 
bambini non aveva effetti significativi sulla loro successiva 
produzione linguistica. 

Infatti le evidenze fornite da molte fonti diverse sembrano 
supportare in maniera significativa la proposta che, per i 
bambini che stanno apprendendo la lingua, ci sia qualcosa 
di bizzarro nel modo in cui l'inglese costruisce le domande. 
È come se si aspettassero che le domande non debbano 
subire cambiamenti nell’ordine delle parole, ma debbano 
essere espresse tramite cambio dell’intonazione - magari 
con l’aiuto di un qualche morfema che indichi il modo 
interrogativo (come nel caso delle negative). Quando 
questa aspettativa non viene rispettata, e specialmente 
quando la violazione ha qualche elemento esotico come 
l'inversione soggetto-ausiliare, i bambini rimangono confusi 
e ci possono volere degli anni (e non giorni o mesi) perché 
acquisiscano pienamente le forme corrette. 

Si noti che, mentre questa proposta rispetta le predizioni 
del modello che sto esponendo qui, i dati da spiegare sono 
oscuri tanto per le teorie dell’apprendimento per induzione 
quanto per le teorie secondo cui il bambino è guidato dalla 
GU. Entrambi i tipi di teorie sono, e devono essere, neutrali 
rispetto alla singola lingua. 

Le teorie induttive dell’apprendimento non possono 
assumere alcun genere di preferenza innata da parte del 
bambino per un certo tipo di struttura sintattica rispetto 
alle altre, perché non c’è niente di innato secondo tali 


teorie. Per gli induttivisti, il cervello del bambino è una 
tabula rasa (eccezion fatta, naturalmente, per quelle facoltà 
che rendono possibile l'apprendimento stesso su base 
induttiva), e quindi tutto deve derivare dall'esperienza. Ma 
dal momento che la maggior parte dei bambini nei moderni 
stati-nazione è esposta a una sola lingua, non deve esserci 
nessun bias rispetto a certe preferenze. Linversione 
soggetto-ausiliare non può essere ritenuta più difficile di 
altri tipi di strutture perché non esiste alcun metro 
oggettivo e universale per la difficoltà linguistica, e i metri 
soggettivi sono determinati dalla lingua che si è appresa. 

Per un parlante dell’inglese adulto, i meccanismi di una 
lingua agglutinante come il turco devono sembrare 
paurosamente difficili - di sicuro, molto più difficili di 
qualsiasi cosa in inglese e senz’altro più difficili da 
imparare per un bambino. Eppure, secondo Aksu-Koc e 
Slobin (1985, p. 845), «il sistema flessivo [del turco] appare 
presto e l’intero insieme delle flessioni nominali e gran 
parte del paradigma verbale viene padroneggiato dal 
bambino entro i 24 mesi, se non prima» - un’eta in cui 
molti bambini parlanti dell'inglese stanno ancora lottando 
per superare la fase delle due parole. Oltre a spiegare 
come questo sia possibile, ricordate che gli induttivisti 
devono anche chiarire perché padroneggiare le 
interrogative in inglese richieda così tanto tempo, dato che 
esse sono almeno un terzo degli input che il bambino 
riceve. 

I resoconti di stampo innatista standard devono essere 
altrettanto neutrali rispetto alla lingua. La GU non può 
ammettere un bias per alcune lingue o tipi di lingue. Tutte 
le lingue umane, e anche tutti i tipi di strutture, dovrebbero 
essere altrettanto semplici da apprendere - tenendo conto 
dei diversi gradi di complessità e della frequenza degli 
input. Nessuno dei due fattori vale in questo caso. Le 
domande hanno un’alta frequenza nel parlato di chi si 
occupa dei bambini e il loro livello di complessità è basso, 


poiché richiede solo un movimento, nel caso delle domande 
con risposta si o no, e due movimenti, nel caso delle 
domande WH. Ricordate che, nel caso delle negazioni, i 
generativisti assumono di norma che si verifichi molto 
precocemente un movimento coperto. Ma perché un 
movimento manifesto dovrebbe essere un problema più 
grande di un movimento coperto? 

In tutte e tre le aree, né le proposte degli empiristi né 
quelle degli innatisti danno dei risultati soddisfacenti. 
Eppure, in tutte e tre le aree le evidenze sono pienamente 
congruenti con una teoria che assume una traccia innata 
limitata per le operazioni della sintassi e però ammette che 
i dettagli su come eseguire quelle operazioni siano appresi 
in maniera induttiva - per tentativi ed errori, si potrebbe 
quasi dire. 


L' «ERRORE» COME FONTE DI COMPRENSIONE 


Quanto appena detto ci suggerisce un modo utile di 
guardare agli «errori» del bambino. Il genere di errori che i 
bambini commettono in maniera tipica e ripetuta dovrebbe 
aiutarci a distinguere in maniera più precisa tra ciò che la 
GU gli rende o meno disponibile. Nel secondo caso, si 
tratta delle cose che vanno apprese e dovremmo quindi 
aspettarci che esse richiedano più tempo. Studi sugli errori 
in lingue diverse (e sulla loro assenza relativa in alcune 
altre) raffineranno ulteriormente questo processo. Se una 
caratteristica particolare viene acquisita facilmente nella 
lingua A, ma solo con molta difficoltà nella lingua B, questo 
suggerisce due cose. Primo: l'acquisizione, laddove riguardi 
le categorie funzionali, potrebbe essere più semplice nelle 
lingue altamente flessive che nelle altre per le ragioni 
spiegate in precedenza, ovvero l'inevitabile ingestione di 
morfemi grammaticali in uno stadio molto più precoce. 
Secondo: l'acquisizione di alcune caratteristiche strutturali 


potrebbe essere molto più difficoltosa in lingue che 
presentano delle deviazioni chiare e inattese dai modi più 
semplici di esprimere gli schemi di base specificati dalla 
GU. 

A questo punto vale la pena di cominciare a considerare 
la significatività delle lingue creole per gli studi 
sull’acquisizione. Queste lingue saranno al centro del 
capitolo 8, ma dal momento che hanno da dire cose 
rilevanti anche sull’acquisizione della lingua, sarebbe 
incompleto non menzionarle pure qui. Bickerton (1981) è 
stato il primo studio a proporre una connessione di questo 
genere. Quel lavoro faceva notare un certo numero di 
«errori» nell’acquisizione che sarebbero stati 
perfettamente grammaticali nelle lingue creole e suggeriva 
l’improbabilita dell’esistenza di due dispositivi per 
l'acquisizione, uno per quando gli input sono solidi e 
uniformi, l’altro per quando invece sono pochi e caotici. La 
presenza di un solo meccanismo, il cui compito non sia 
discriminare tra una gamma di lingue possibili ma produrre 
una lingua di un particolare tipo, consentirebbe di predire 
l’occorrenza di errori simili alle strutture delle lingue 
creole durante l'acquisizione di lingue non creole. 

E infatti troviamo delle similarità tra le lingue creole e i 
dati sull’acquisizione in tutte e tre le aree appena viste. 
Tipicamente, lo stesso verbo può essere usato in senso sia 
causativo sia non causativo: we plant the tree («abbiamo 
piantato l'albero») in opposizione a the tree plant («l'albero 
si radica»); talvolta anche i nomi vengono trasformati in 
verbi causativi, come in we cobweb the house 
(«rimuoviamo le ragnatele dalla casa» nel creolo della 
Guyana, letteralmente: «ragnatelizziamo la casa») e we 
lawnmower the yard («tosiamo l’erba in giardino» nel 
creolo inglese hawaiano, letteralmente: «tosaerbiamo il 
giardino»). Nelle lingue creole che hanno l’inglese come 
lessificatore principale, le ‘frasi negative hanno 
invariabilmente la forma Soggetto + no + sintagma 


verbale. Le domande mantengono l’ordine affermativo e 
sono marcate solo dall’intonazione con l’aggiunta 
occasionale di una particella interrogativa. In altre parole, 
è proprio in quei punti in cui le lingue creole differiscono 
dall'inglese che troviamo i problemi più persistenti per i 
bambini nell’acquisizione dell’inglese (una lingua isolante 
che dovrebbe essere abbastanza facile da acquisire come 
una lingua creola). 

La grammatica innata non distinguerebbe i verbi 
causativi dai verbi non causativi, dal momento che tutti i 
suoi processi sono universali e, se un processo si applica a 
un verbo, a un nome, a un sintagma o a una frase, si 
applica potenzialmente a tutti i membri della classe. Allo 
stesso modo, la grammatica innata non ha nulla da dire 
circa le distinzioni tra diversi tipi di frasi (affermative, 
negative, interrogative): viene assunto un solo ordine delle 
parole. Ne segue che gli «errori» si concentreranno in quei 
punti in cui la lingua che il bambino sta apprendendo ha 
introdotto delle modifiche o delle aggiunte alla grammatica 
innata. 

La tesi secondo cui i bambini si sono adattati per 
imparare una lingua di un genere particolare è stata fin da 
principio controversa. Essa contraddice apertamente una 
convinzione diffusa tra empiristi e innatisti -cioè che i 
bambini non si siano adattati in maniera particolare per 
parlare un certo tipo di lingua o, in altri termini, che essi 
siano egualmente adattati per parlare lingue di ogni tipo. 
Sorprende, dunque, che praticamente nessuno abbia 
provato a testare una delle predizioni più chiare di quella 
tesi: che le lingue creole dovrebbero essere acquisite più 
velocemente e commettendo meno errori rispetto alle 
lingue non creole. Gli unici studi di cui io sia a conoscenza 
sono stati condotti da Dany Adone e riguardano 
l'acquisizione del mauriziano (il creolo delle Mauritius) - si 
tratta di un breve saggio sull’acquisizione del movimento 
delle parole WH (Adone e Vainikka 1999) e di due libri 


(Adone 1994, 2012), il secondo dei quali è un’estensione 
del primo e include del lavoro sperimentale sul seselwa (il 
creolo delle Seychelles). 

I risultati di Adone sono suggestivi. Per esempio, ha 
scoperto che il sistema TMA, che segue lo schema generale 
dei sistemi TMA creoli, è acquisito quasi senza errori. Degli 
errori significativi si verificano solo laddove il mauriziano 
ha introdotto dei marcatori TMA in aggiunta ai tre di base - 
cioè l’anteriore (un passato con un tema presente invece 
che con un punto di riferimento coincidente con il momento 
del proferimento), l’irreale (futuri, condizionali, congiuntivi, 
ecc.) e il non-puntuale (azioni ancora in atto o abituali; per 
ulteriori informazioni sui sistemi TMA creoli, si veda il 
capitolo 8). Per esempio, (fi) n, un perfettivo, veniva a volte 
confuso con l’anteriore ti, e la divisione delle funzioni 
dell’irreale tra il futuro definito pu e l’indefinito ava 
generava ulteriori confusioni. I bambini, a metà del loro 
terzo anno di vita, producevano regolarmente delle frasi 
grammaticalmente corrette contenenti due clausole: 


5. kone kot li’n ale. 
so dove egli PERF andare. 
«So dove è andato» (Rod, età due anni e quattro 
mesi). 

6. kuma sa pu buze mo pu tonbe. 
quando questo IRR muovere io IRR cadere. 
«Non appena questo si muove, io cadrò giù» 
(Ter, due anni e quattro mesi). 

7. get lakaz pu rant dan garaz la. 
guardare casa IRR entrare in garage il. 
«Guarda la casetta (giocattolo) che può entrare 
nel garage» (Ben, due anni e sette mesi). 


Inoltre i bambini sembravano quasi ri-creolizzare le 
lingue creole: nel seselwa moderno, le costruzioni seriali 
dei verbi hanno avuto la tendenza a divenire stereotipate e 


limitate rispetto al numero di verbi che si possono 
utilizzare in esse, ma i bambini che parlano seselwa hanno 
usato i seriali molto più liberamente e in maniera più 
produttiva (Adone 2012, p. 144). 

Questo campo di ricerca ha un disperato bisogno di nuovi 
studi sull’acquisizione delle lingue creole oggi, 
specialmente quelle che sono state influenzate dal contatto 
con altre lingue. (Il saramaccano è il primo esempio). Tali 
studi dovrebbero essere sia longitudinali sia trasversali, in 
modo che lo sviluppo di singoli individui possa essere 
seguito per un periodo di alcuni anni. La teoria che 
presento qui predice una particolare serie di risultati. I 
bambini che acquisiscono una lingua creola dovrebbero 
commettere meno errori di quelli che acquisiscono una 
lingua non creola. I bambini che acquisiscono una lingua 
non creola fanno «errori» che hanno somiglianze con certe 
strutture tipiche delle lingue creole, ma i bambini che 
acquisiscono le lingue creole dovrebbero raramente (se non 
mai) fare «errori» che assomigliano a strutture che non si 
trovino nelle lingue creole ma nelle lingue non creole. Se 
emergono errori di questo tipo dovrebbero concentrarsi in 
quelle aree in cui il creolo in questione devia in maniera più 
marcata rispetto alle istruzioni innate per costruire la 
lingua. I bambini che acquisiscono una lingua creola 
dovrebbero raggiungere uno stadio finale, corrispondente 
alla competenza degli adulti, (mediamente) a un’età 
significativamente inferiore rispetto a quella dei bambini 
che acquisiscono lingue non creole. 

Se questi studi falsificassero una qualsiasi di queste 
quattro predizioni, ciò andrebbe contro la teoria che sto 
presentando. Se falsificassero molte o anche tutte queste 
predizioni, la teoria si troverebbe in guai seri. 

D'altra parte, naturalmente, se le predizioni sono 
confermate, questo sarebbe di grande supporto per la 
teoria. Una ragione forte per essere ottimisti è la 
cosiddetta esplosione sintattica (Radford 1990). A partire 


dal terzo anno di vita (0 poco dopo), i bambini (almeno 
quelli che stanno apprendendo l’inglese) tipicamente 
sviluppano un’ampia gamma di strutture, incluse quelle 
biclausali. Per molti bambini questo processo è 
estremamente rapido. Nell’arco di meno di tre mesi, Seth è 
passato da dire Putting boots. Putting boots on. Daddy 
boots on a dire I don’t know where Pink Eddie go, Didja go 
the beach and see the birds, Didja give the bread the birds 
(queste probabilmente non sono domande, come si è fatto 
notare nell'esempio (2)), Daddy made it go ding, I forget to 
push a light, I like to stay in the cemetery. I lavori 
sperimentali di Crain (1991) e altri hanno mostrato che 
entro i tre anni i bambini sono in grado di produrre in 
maniera corretta una gamma di strutture molto più ampia 
di quanto abbiano mai avuto occasione di fare quando 
parlano spontaneamente. 

Per rendere conto di questo fenomeno sono state 
proposte diverse spiegazioni che in genere fanno appello a 
un qualche ritardo nella maturazione della GU (Radford 
1990; Borer e Wexler 1987, 1992), tale da impedire che 
l’intera gamma di opzioni strutturali venga elaborata dai 
bambini. Tuttavia sia i dati empirici (Slobin 1985) sia 
problemi di natura teorica (Boser et al. 1992; Deprez e 
Pierce 1993) supportano l’«ipotesi della continuità», 
secondo cui la GU è interamente presente durante tutto lo 
sviluppo. Anche dal punto di vista che difendo qui, non 
sembra che serva postulare alcuna forma di maturazione 
della grammatica. L'esplosione sintattica inizia 
immediatamente dopo l’«esplosione lessicale», 0 
«esplosione del vocabolario» (Goldfield e Reznick 1996; 
Anisfeld et al. 1998), un aumento nel ritmo 
dell’apprendimento delle parole. Sembra quasi che l’unica 
cosa che impedisce al bambino di produrre delle strutture 
più lunghe e complesse prima di tale esplosione lessicale 
sia che gli manchino la quantità e il genere di parole 


necessarie a riempire tutti gli spazi vuoti all’interno di 
quelle strutture. 

I dati provenienti dalle circostanze «normali» - in questo 
caso, l’acquisizione di lingue ben consolidate sulla base di 
abbondanti, regolari e omogenei input provenienti dalle 
persone che si prendono cura del bambino - raramente 
sono, di per sé, adeguati per rispondere alle domande 
scientifiche. Purtroppo i metodi sperimentali, che in questo 
caso richiederebbero di far crescere dei bambini con un 
qualche grado di privazione degli input, non sono 
praticabili per ragioni etiche. Dobbiamo allora rivolgerci a 
degli «esperimenti naturali»: delle circostanze anomale, 
nelle quali gli input dati ai bambini sono stati distorti, 
degradati o in qualche modo limitati. Sembra che ci siano 
solo due situazioni di questo tipo: quella dei «ragazzi 
selvaggi» (bambini che, per una ragione o per l’altra, hanno 
avuto pochi contatti, o nessun contatto, con altri esseri 
umani) e quella in cui si generano le lingue creole. Il primo 
caso è raro, poco documentato (e spesso in maniera 
fuorviante) e chiama in causa delle considerazioni (come un 
possibile «periodo critico» che rende impossibile 
l'acquisizione dopo una certa eta) non rilevanti per 
determinare il modo in cui il linguaggio è strutturato. Di 
conseguenza, esso non verrà affrontato in questa sede. 


CREOLIZZAZIONE 


A lungo le lingue creole sono sfuggite a una definizione 
precisa. In generale, vengono intese come delle lingue 
relativamente nuove, formatesi per lo più (ma comunque 
non necessariamente o esclusivamente) sulla base del 
contatto tra parlanti di lingue europee e parlanti di lingue 
non europee. Mentre molte di esse (se non tutte) prendono 
il proprio vocabolario da una singola lingua europea (il loro 
«lessificatore principale»), le loro grammatiche contengono 
molti elementi non europei. Le lingue creole non si 
adattano facilmente alle categorie tradizionali. Di 
conseguenza, quasi tutto ciò che d’altro si può dire su di 
esse è in qualche misura controverso. 

Secondo una teoria (Hall 1966), le lingue creole si sono 
originate come parte di un «ciclo pidgin-creolo»: 
tipicamente, degli europei entrano in contatto con dei non- 
europei e da qui nasce una lingua di contatto grezza (un 
pidgin). Un pidgin non è la lingua-madre di nessuno. 
Tuttavia, se acquisito dai bambini, si regolarizza in fretta e 
sviluppa tutte le risorse di una vera e propria lingua 
umana. La lingua creola che risulta da questo processo ha 
un destino variabile. Se rimane in contatto con il proprio 
lessificatore principale, si può «decreolizzare» - le 
differenze grammaticali con il lessificatore si riducono - 
fino al punto di diventare difficilmente distinguibile da un 
dialetto non standard di quest’ultimo. Se perde contatto, 
sarà soggetta soltanto al processo di cambiamento 
linguistico tipico di ogni lingua. Sebbene l’idea che questo 


ciclo esista sia stata recentemente messa in dubbio 
(Mufwene 2001; DeGraff 2003, 2005; Ansaldo e Matthews 
2007), l’unico creolo di cui conosciamo storia e preistoria 
nei dettagli, il creolo inglese delle Hawaii (CIH), ha seguito 
quel ciclo in tutte le sue fasi, e non sono state fornite 
ragioni sufficienti per supporre che le altre lingue creole 
delle piantagioni abbiano avuto uno sviluppo diverso. 

Da Coelho (1880-1886) in poi è risaputo che le lingue 
creole si somigliano tra loro molto più di quanto ci si 
aspetterebbe da lingue che si sono sviluppate in parti 
diverse del mondo e che hanno dei parlanti le cui lingue 
d’origine sono molto diverse da un punto di vista genetico e 
tipologico. Il fatto che ci si sia concentrati più sulle 
somiglianze che sulle differenze è stato criticato da 
Mufwene (2001, pp. 51-52), dal momento che «non ci sono 
ragioni forti per ridurre il ruolo delle differenze a favore di 
quello delle somiglianze ... Entrambe sono parimenti 
significative». Questo può essere vero solo se si hanno degli 
interessi puramente tassonomici. Chiunque abbia obiettivi 
scientifici (cioè esplicativi) si concentrerà, come in ogni 
altro caso, su quelli che sono gli aspetti più inattesi di un 
fenomeno, vale a dire quelli che maggiormente richiedono 
una spiegazione. In questo caso, date le (almeno) centinaia 
di lingue di tipologia ampiamente diversa parlate dai 
genitori dei primi parlanti di creolo, e data l’assenza di 
contatto tra le regioni interessate, le somiglianze tra le 
lingue creole sono senza dubbio i fenomeni più inattesi. 

Coelho (1880-1886) aveva proposto che le somiglianze 
siano il risultato di tendenze psicologiche universali, 
all'epoca misteriose. Dopo Chomsky è parso naturale 
trovare la fonte di quelle somiglianze in qualche forma di 
grammatica innata (Bickerton 1974, 1984b). Fu per questa 
ragione che, in prima battuta, avevo proposto l’idea che 
esista un programma biologico per il linguaggio, il 
Bioprogramma Linguistico (d’ora in avanti BL; Bickerton 
1981, p. 133). Viste così, le lingue creole sarebbero una 


serie di esperimenti naturali che presentano vari gradi di 
deformazione e privazione degli input, i cui risultati 
potrebbero dirci che cosa ci sia di innato e di appreso nel 
linguaggio. Come per tutti gli esperimenti naturali, questi 
risultati non sono nitidi e possono generare confusione. Ma, 
poiché l’unico modo per ottenere risultati più chiari 
implicherebbe limitare gli input linguistici a diversi gruppi 
di bambini - un tipo di esperimento che è escluso sulla base 
di considerazioni di ordine etico -, quei risultati sono 
probabilmente il meglio che possiamo avere. 

Sebbene la teoria che presento qui differisca per molti 
aspetti dal BL originario (tra le altre cose, è ora più 
fermamente radicata nella teoria dell'evoluzione), le sue 
predizioni sulle lingue creole non sono nella sostanza 
diverse da quelle originarie. Poiché i bambini iniziano a 
sviluppare la sintassi senza troppo riguardo per la lingua 
che si suppone stiano «imparando», e poiché gli input (di 
pidgin) che ricevono contengono pochi elementi in aggiunta 
o contrari ai loro algoritmi innati, danno origine a strutture 
simili in tutto il mondo, nonostante l'ampia varietà delle 
lingue parlate intorno a loro. Dal momento che la natura gli 
ha dato in dotazione dei meccanismi capaci di generare una 
lingua completa, il processo di creolizzazione può essere 
portato a termine nel giro di una sola generazione. Siccome 
dopo che si sia imparata una lingua non è più possibile 
accedere direttamente a quei meccanismi, solo i bambini 
possono dar vita a una lingua creola. 

Una volta che si comincino a guardare le lingue creole 
assumendo una prospettiva universale, il problema di darne 
una definizione cambia. Le lingue descritte come creole 
non formano una classe naturale. Le lingue creole delle 
piantagioni differiscono in alcuni aspetti, ma non in tutti, da 
quelle dei forti (lingue emerse da contatti per scambi 
commerciali in loco tra europei e non-europei in Africa e 
Asia), le quali a loro volta sono diverse dai pidgin tardo- 
creolizzati (tipicamente, i pidgin del Pacifico, che hanno 


iniziato ad avere dei parlanti madrelingua solo dopo che, 
per diverse generazioni, erano stati parlati soltanto dagli 
adulti). Queste differenze non hanno nulla a che vedere con 
le peculiarita delle aree in cui si sono sviluppate; hanno, 
invece, parecchio a che vedere con la natura molto diversa 
e il volume dei contatti tra i partecipanti coinvolti. Andare 
alla ricerca di una «teoria della creolizzazione» è quindi 
una perdita di tempo, se con questo si intende una teoria 
che offra una sola spiegazione per tutte le lingue che sono 
state descritte come creole. 

Al contrario, le lingue creole delle piantagioni formano 
una classe naturale, creando così il miglior laboratorio in 
natura che ci si potrebbe ragionevolmente aspettare. 
Luniformita e l’ubiquità dei processi economici coinvolti 
nelle società basate sulle piantagioni, descritti più avanti, 
rimuovono dal contesto ogni elemento variabile. Le 
variabili che restano - l’etnia della popolazione, i profili 
demografici, la durata delle varie fasi dell'economia di 
piantagione - sono istruttive e non creano confusione, una 
volta che si sia afferrata l’idea che c’è un continuum tra le 
lingue creole. 


IL «CONTINUUM» DELLE LINGUE CREOLE 


Bisogna distinguere tra un continuum tra le diverse 
lingue creole e un continuum creolo, sebbene i processi alla 
base di entrambi i fenomeni siano gli stessi. In un 
continuum creolo (DeCamp 1971; Bickerton 1971, 1973) 
come quello che c’é in Giamaica, Guyana e Hawaii, invece 
di una sola grammatica relativamente omogenea, abbiamo 
uno spettro (più o meno) continuo di grammatiche che 
variano da un estremo (largamente incomprensibile per i 
parlanti dell’inglese meno acculturati) a un altro (appena 
distinguibile dalle forme dialettali dell’inglese). (Si veda 
Bickerton 1975/2009 per una descrizione dettagliata di 


questo spettro). Un continuum creolo emerge perché in 
alcune lingue creole, in periodi diversi o a livelli sociali 
diversi, i parlanti hanno avuto diversi gradi di accesso al 
lessificatore e le diverse varianti che ne sono risultate 
continuano a persistere ancora oggi. In queste circostanze, 
lo scarto tra ciò che forniscono gli input e ciò che è 
richiesto da una lingua umana completa - e quindi ciò che 
va ricavato dalla GU e dalle strategie scelte per le aree 
sotto-specificate dalla GU - varierà inevitabilmente, 
richiedendo più rimedi alle sotto-specificazioni in alcune 
varietà e meno in altre. 

Se questo è vero perfino all’interno di ciascuna lingua 
creola, lo deve essere a maggior ragione dell’intero che 
esse formano. Nessuna coppia di lingue creole ha il 
medesimo profilo storico. Esse variano per date del primo 
contatto, tassi di cambiamento demografico, percentuale di 
parlanti del lessificatore e altri fattori; e così, anche 
l'accessibilità al lessificatore principale e la conseguente 
ampiezza della distanza tra input e lingua vera e propria 
varieranno da un creolo a un altro. Per quanto non ci sia un 
metro oggettivo per misurare la distanza strutturale tra 
due lingue qualsiasi, delle stime grezze sul numero delle 
discordanze tra creolo e lessificatore possono essere poste 
su un continuum, che va da quelle lingue creole che 
differiscono in maniera radicale dai loro lessificatori a 
quelle che ne differiscono poco (in proporzione), con altre 
che occupano posizioni intermedie. Chiaramente, il primo 
di questi raggruppamenti - quello delle lingue creole che 
differiscono in maniera radicale dai propri lessificatori - è il 
più interessante da un punto di vista linguistico, in quanto 
tali lingue dovrebbero essere le più vicine all’output di una 
GU pura e dovrebbero mostrare la più ampia componente 
di strategie non apprese. 

L'idea che ci sia un continuum tra le lingue creole offre un 
possibile modo per falsificare la teoria che sto presentando 
qui, dalla quale consegue che esista una relazione di 


implicazione tra le lingue creole. Purché ci limitiamo alle 
lingue creole delle piantagioni, dovrebbe essere possibile 
ordinarle in questo modo: assumendo che quella più a 
sinistra abbia l'insieme più ampio di elementi grammaticali 
non dovuti al lessificatore, quella immediatamente alla sua 
destra avrà un sottoinsieme di quegli elementi, quella dopo 
avrà un sottoinsieme degli elementi della seconda e così 
via, fino ad arrivare a quella più a destra di tutte, la quale 
avrà il sottoinsieme più piccolo. Se si provasse che è 
impossibile ordinare le lingue creole in questo modo, ciò 
andrebbe contro la mia teoria. Inoltre, l'ordinamento 
dovrebbe corrispondere ai dati storico-sociologici: le lingue 
creole delle aree che hanno avuto una maggior esposizione 
al lessificatore dovrebbero trovarsi sempre alla destra delle 
lingue creole che ne hanno avuta una minore. Qualsiasi 
inversione di questa relazione andrebbe altrettanto contro 
la mia teoria. 

Nel resto di questo capitolo discuterò soltanto delle 
lingue creole delle piantagioni e userò il termine creolo 
solo per riferirmi a quelle, salvo diversa indicazione. Tra le 
lingue creole delle piantagioni (considerate come gruppo di 
cui fanno parte anche le lingue parlate da quanti sono 
scappati dalle piantagioni) ci sono tutte le lingue creole più 
radicali, e le circostanze che le hanno originate riducono le 
variabili storico-sociologiche (anche se naturalmente non 
possono eliminarle) a livelli più bassi rispetto a quelli di 
ogni altro tipo di lingua creola. Allo stesso modo, il termine 
pidgin si riferirà a quel tipo di protolingua che ha 
immediatamente preceduto il creolo - come empiricamente 
dimostrato nelle Hawaii e come si può ricostruire nel caso 
delle altre lingue creole (quella cosa talvolta chiamata 
«gergo») - e non alle varietà stabilizzate e 
grammaticizzate. 


IL CICLO DELLA PIANTAGIONE 


Le lingue creole delle piantagioni sono il risultato di un 
ciclo socio-economico che ha avuto luogo, con piccole 
variazioni, in molte isole dei Caraibi, nel Golfo di Guinea, 
nell’Oceano Indiano e (in un caso) nel Pacifico, cosi come in 
alcune zone isolate del Sud America: in tutti i casi (a 
eccezione delle Hawaii) si trattava di aree originariamente 
disabitate o poco abitate. Le popolazioni originarie erano di 
piccole dimensioni e includevano porzioni più o meno 
uguali di parlanti europei (per lo più monolingui) e non 
europei (in genere monolingui) (Baker e Corne 1982). In 
queste circostanze, i non-europei avevano delle buone 
probabilità di acquisire come seconda lingua la lingua 
dominante europea. 

Le cose cambiarono quando gli alti profitti derivanti dallo 
zucchero spinsero a trasformare le piccole proprietà 
coloniche in grandi piantagioni. Un’industria basata sul 
lavoro intensivo e il bisogno di recuperare in fretta i costi 
dell’investimento iniziale causarono un afflusso di massa e 
molto rapido di schiavi. In questa fase, l'importazione di 
schiavi nel Suriname aumentò di settanta volte in vent'anni 
(Arends 1995) e la Giamaica vide crescere la propria 
popolazione non europea di novanta volte in meno di 
trent'anni (Kouwenberg 2009); mentre la popolazione non 
europea a Haiti, che era cresciuta di venti volte in un primo 
periodo di quarant'anni, crebbe di duecento volte in poco 
meno di un secolo (Singler 2006). Negli stessi periodi di 
tempo, invece, la popolazione europea raramente si era 
raddoppiata o triplicata. 

Da un punto di vista linguistico, le conseguenze di questa 
rapida espansione furono massicce e sono state mal 
interpretate da molti studiosi delle lingue creole, i quali 
assumono che se nel primo periodo si era venuta a creare 
una varietà di contatto del lessificatore principale, quella 
varietà sarebbe stata trasmessa anche ai nuovi arrivati. 
Una qualche progressiva «basilettizzazione» (Chaudenson 
1992, 2001; Mufwene 1996a, 1996b) potrebbe aver fatto si 


che il creolo si staccasse dal proprio lessificatore, a causa 
dell’apprendimento imperfetto da parte di ciascuna ondata 
di immigrati. Non è stata prodotta alcuna evidenza 
empirica a supporto di questo processo. In realtà, l’inizio 
dello stadio di espansione fu così improvviso e il suo ritmo 
tanto rapido che è altamente improbabile che si sia 
verificata una degradazione progressiva della lingua di 
contatto iniziale. Quest'ultima sarebbe stata tanto 
impenetrabile per i nuovi arrivati quanto il lessificatore. Ma 
coloro ai quali era affidato il compito di preparare i nuovi 
arrivati e spiegare loro il programma di lavoro non 
avrebbero potuto permettersi di aspettare che questi la 
imparassero. Per comunicare con i nuovi arrivati (o perché 
questi ultimi comunicassero con loro), tutte le parti 
dovevano adottare un pidgin rudimentale, il mezzo che 
avrebbe fatto da input principale per il creolo che alla fine 
si sarebbe sviluppato. Le Hawaii offrono abbondanti 
evidenze (Roberts 1995, senza data) del fatto che la rapida 
espansione condusse alla completa destabilizzazione di un 
precedente pidgin semistabilizzato e in via di espansione 
(basato non sull’inglese ma sull’hawaiano dialettale) che, 
prima del 1876, era molto più diffuso del pidgin basato 
sull’inglese. In tutte le altre società creole c’è poca o 
nessuna evidenza della fase che precede il creolo, il che ha 
permesso la fioritura delle tesi «negazioniste sul pidgin» (si 
veda più avanti). 

Un pidgin rudimentale formava quindi una parte 
significativa dell'input che ricevevano i bambini nati in 
loco. Un'altra parte consisteva di (per lo meno molte) 
lingue non europee che avrebbero continuato a essere 
usate insieme al pidgin da coloro che venivano da fuori. Ma 
l’idea che i bambini nati nella colonia acquisissero una 
padronanza delle lingue dei loro genitori sufficiente per 
poter imporre le strutture di quelle lingue al creolo che si 
andava sviluppando, sebbene sia diffusa tra gli studiosi 


delle lingue creole, trova poco riscontro nei dati storico- 
sociologici. 

Considerate il ciclo di vita di un bambino schiavo medio, 
tenendo a mente che «ora c’é consenso tra gli studiosi sul 
fatto che le donne rese schiave ebbero un ruolo-chiave 
nella forza-lavoro nelle piantagioni di zucchero dei Caraibi 
inglesi» (Brereton 2005, p. 144). Di conseguenza, dopo il 
parto, le donne ritornavano al lavoro nei campi il prima 
possibile, lasciando altre donne ad allattare e curare i 
propri figli - donne alle quali quei bambini erano spesso 
anche più legati che alle proprie madri (Hindman 2009, p. 
429). Negli asili delle piantagioni, che raccoglievano 
bambini provenienti da diversi gruppi etnici, il pidgin 
sarebbe stato l’unico mezzo grazie al quale essi avrebbero 
potuto parlare tra loro nella fase più critica del loro 
sviluppo linguistico. In seguito, dai cinque anni in poi, i 
bambini lavoravano nella «terza squadra», impiegata nel 
lavoro di pulitura (Higman 1995, p. 162). Qui avrebbero 
interagito principalmente con gli altri bambini. Avrebbero 
visto i propri genitori (sempre che fossero sopravvissuti) 
principalmente di domenica e durante le feste. Ne segue 
che i bambini cresciuti in queste condizioni nelle 
piantagioni avrebbero avuto più bisogno del pidgin che 
della lingua (o delle lingue) parlata dai propri genitori. 

L'espansione non si sarebbe arrestata finché la maggior 
parte delle terre coltivabili (se non tutte) non fosse stata 
sottomessa alle esigenze produttive. A quel punto le 
popolazioni si sarebbero stabilizzate, con i proprietari 
terrieri che avrebbero importato gli schiavi necessari per 
controbilanciare la crescita negativa della popolazione. A 
partire da questo momento, una lingua creola sarebbe già 
stata pienamente sviluppata, e gli immigrati successivi 
l'avrebbero appresa come seconda lingua. 

Alla luce di tutto questo, è curioso leggere che «per molti 
altri studiosi delle lingue creole, lo scenario richiesto 
dall’Ipotesi del Bioprogramma Linguistico per la genesi del 


creolo è in tensione con dei fatti ben noti circa la storia 
delle colonie in cui sono emerse le lingue creole» 
(Kouwenberg e Singler 2008, p. 4). Gli autori non citano un 
solo scenario alternativo dato da questi «altri studiosi delle 
lingue creole» né uno dei «fatti ben noti» sui quali si 
baserebbero le loro opinioni. Dal momento che più avanti in 
questo capitolo verrà proposto un resoconto più dettagliato 
di quanto è accaduto in due dei più importanti siti per la 
formazione di una lingua creola, le Hawaii e il Suriname, il 
lettore potrà farsi una propria opinione su quale sia il 
racconto più aderente ai fatti. Le tesi esposte in Bickerton 
(1981, 1984b) - che le lingue creole sono prodotte dai 
bambini, nell’arco di una sola generazione, a partire da uno 
stadio precedente in cui c’è un pidgin relativamente privo 
di struttura, con l’ausilio del programma innato per il 
linguaggio - sono state frequentemente messe in 
discussione, ma mai in maniera convincente - e anzi, 
spesso, in barba all'evidenza empirica. 


CRITICHE AL PROGRAMMA INNATO 


Prima di concentrarci sulle critiche specifiche, è 
necessario liberarci di alcune confusioni di cui io stesso 
sono largamente responsabile e la cui gravità è rivelata da 
Baptiste (2012) e McWhorter (2013). Esse riguardano la 
relazione tra il BL e la Grammatica Universale di Chomsky. 

Chiaramente, la GU chomskiana è stata da stimolo per il 
BL: senza di essa, il BL non avrebbe neppure potuto essere 
formulato come ipotesi. All’inizio (Bickerton 1974), il mio 
interesse non era tanto rivolto a cosa fosse il BL; piuttosto, 
ero interessato a stabilirne i contenuti sulla base delle 
evidenze provenienti dal creolo (quelle aree in cui le 
grammatiche delle lingue creole delle piantagioni 
mostravano un grado di somiglianza più elevato rispetto a 
quanto predicessero le teorie esistenti). Entro il 1981 mi 


ero formato un’idea vaga del fatto che il BL fosse un’unica 
grammatica monolitica; ma come questo si connettesse al 
modello chomskiano rimaneva ancora un mistero. Nei loro 
commenti a Bickerton (1984b), diversi generativisti 
facevano notare questa cosa. Ricordate che l’articolo in 
questione era stato pubblicato in un momento in cui il 
modello principi e parametri della GU (Chomsky 1981), un 
risultato sbalorditivo in termini concettuali, era appena 
apparso e stava acquisendo un prestigio enorme. 
Ovviamente, non avrebbero potuto esserci due 
Grammatiche Universali. Ma sembrava che i due modelli 
potessero essere facilmente conciliati fra loro. Le lingue 
creole avrebbero potuto rappresentare l’insieme di 
parametri non marcati all’interno di una GU 
parametrizzata; e se «parametro non marcato» significava 
«parametro predefinito», quell’impostazione sarebbe stata 
assunta dal bambino in assenza di evidenza contraria 
(Bickerton 1984a, 1986). Dal momento che in molti casi le 
evidenze contrarie provenienti da un input di pidgin 
sarebbero state troppo limitate e contrastanti per poter 
stabilire le impostazioni, l'insieme dei parametri predefiniti 
si sarebbe applicato in maniera ripetuta in lingue creole 
diverse. 

A questo punto (alla fine degli anni ottanta), il fuoco 
principale del mio interesse si è diretto sull'evoluzione del 
linguaggio e, da allora in avanti, tutto ciò che ho pubblicato 
sulle lingue creole è stato in reazione alle cose che 
pubblicavano gli altri. In realtà, solo di recente ho capito 
che questo è stato un esito fortunatissimo. È diventato 
chiaro che non si può sperare di comprendere appieno 
come sono emerse le lingue creole se non si è capito come 
si sia evoluto il linguaggio; e la comprensione di come Si sia 
evoluto il linguaggio ha suggerito che la vera natura della 
sintassi (il misto di materiali biologicamente dati e 
induttivamente appresi che ho descritto in questo libro) 
non sia quella ipotizzata da ogni altro resoconto avanzato 


finora. Tra i benefici di questo nuovo resoconto c’era una 
chiarificazione finale della relazione tra il BL e la GU. 

I due non possono coesistere: sono teorie diverse della 
stessa cosa. Il BL, come lo concepisco ora, è la singola 
grammatica monolitica suggerita all’inizio, ma dotata di un 
ambito molto più ristretto, come ha mostrato il capitolo 5. 
In quanto tale, si pone in netto contrasto con le versioni più 
ricche della GU, come il modello dei princìpi e parametri, 
ma molto meno con i modelli impoveriti del Programma 
Minimalista, come quelli proposti da Hornstein (2009) e 
Boeckx (2010). Il BL è usato dai bambini nelle circostanze 
del processo di creolizzazione proprio come è usato dai 
bambini per definire le impostazioni delle lingue «normali» 
già consolidate (si veda il capitolo 7). Quello che cambia nei 
due casi è la quantità o la qualità dei dati linguistici 
primari. Di conseguenza, le lingue creole consistono di: 


1. Algoritmi universali per la costruzione di sintagmi e 
frasi. 

2. Strategie minime di riparazione per le aree lasciate 
non-specificate da quegli algoritmi. 

3. Ogni fenomeno di sostrato o superstrato 
sufficientemente saliente e consistente all’interno dei dati 
del pidgin. 


Non si assume più, come invece succedeva in Bickerton 
(1984a), che le impostazioni non marcate dei parametri 
potrebbero essere il BL; le nozioni stesse di «parametro» e 
«marcatezza» non sono più rilevanti. 

La variazione quantitativa del contribuito di (3) è, 
naturalmente, ciò che causa sia il continuum tra le diverse 
lingue creole sia il continuum all’interno di alcune lingue 
creole. Tale quantità viene facilmente sovrastimata. 
Prendete, per esempio, le costruzioni dei verbi seriali nelle 
lingue creole: tali costruzioni si ritrovano in un’ampia 
gamma di lingue di sostrato ed è convinzione diffusa che 


siano dovute alla sua influenza. In realta, esse sono delle 
conseguenze naturali degli algoritmi innati. Dal momento 
che questi ultimi non impongono alcuna restrizione sul 
contenuto della testa o del modificatore, i verbi possono 
liberamente modificare altri verbi. Se possedere un 
sostrato serializzante fosse una condizione necessaria e 
sufficiente per avere le costruzioni dei verbi seriali in 
creolo, queste strutture non si ritroverebbero nelle lingue 
creole dell’Oceano Indiano (nelle quali invece la loro 
presenza è oggi data per scontata dai linguisti di lingua- 
madre; si vedano Adone 2012; Syea 2013), poiché queste 
non hanno lingue di sostrato serializzanti. 

Laddove vengono intraprese strategie per ovviare alle 
sotto-specificazioni, le possibilità possono essere 
decisamente limitate nel numero - nei casi estremi, si 
riducono anche solo a una. È difficile vedere come un 
insieme di pronomi interrogativi possa essere ricreato, 
come accade in sranan tongo, haitiano e altre lingue creole 
delle piantagioni, se non prendendo una qualsiasi forma 
interrogativa che possa essere tratta dal pidgin e 
attaccandola alle parole che indicano tempo, luogo, 
persona, cosa e così via. In altri casi, una singola strategia 
può superare per valore qualsiasi alternativa. Per esempio, 
per quanto riguarda il sistema TMA (si veda più avanti), c’è 
solo un modo logicamente possibile in grado di combinare 
una minima quantità di materiale lessicale con la massima 
quantità di copertura semantica esplicita. La fonte proposta 
in questo capitolo sembra più plausibile in termini evolutivi 
rispetto ai meccanismi esplicitamente dedicati al 
linguaggio suggeriti nelle precedenti trattazioni. 

Non mi stancherò mai di ribadire che nessuno dei 
cambiamenti nelle assunzioni in merito al contenuto dei 
componenti innati fa la minima differenza rispetto alle tesi 
originali del BL indicate in precedenza. Ciascuna di queste 
tesi è stata ripetutamente messa in discussione negli ultimi 
quattro decenni. Si è sostenuto che fossero gli adulti, e non 


i bambini, gli attori principali del processo di 
creolizzazione. Si è detto che il processo di creazione del 
creolo durasse più di una generazione (forse addirittura 
molte). La stessa esistenza dei pidgin precreoli è stata 
negata. Le differenze tra le lingue creole sono 
apparentemente tanto grandi che nessun meccanismo 
innato, sempre che ce ne sia uno, potrebbe aver giocato un 
ruolo significativo nella loro comparsa. Laddove gli 
elementi nelle lingue creole sono diversi da quelli dei loro 
lessificatori europei, queste differenze vengono attribuite 
alle continue influenze delle lingue di sostrato (le lingue- 
madri degli antenati dei parlanti di creolo). 

Quando si valutano le critiche, è importante riconoscere 
che ciò che sta alla base di esse è una certa forma mentis 
comune agli studiosi di lingue creole che non è sconosciuta 
neppure altrove. Secondo questa forma mentis, tutto deve 
provenire da qualche altro posto. Ogni struttura e 
caratteristica del creolo deve avere la propria origine in 
qualche altra lingua già esistente, che è stata in qualche 
modo coinvolta nel processo di creolizzazione. Di 
conseguenza, vanno trovate queste origini: una volta 
identificate, avremo spiegato la creolizzazione. Forse coloro 
che hanno questa forma mentis non si sono resi conto che, 
se avessero ragione, nel linguaggio non potrebbe sorgere 
mai nulla di nuovo - né sarebbe mai potuto sorgere nulla di 
nuovo. Questo ci imporrebbe di scegliere tra due 
conclusioni altrettanto bizzarre: che il linguaggio è sempre 
esistito nella sua forma attuale oppure che esso non esiste 
affatto. Le prossime sezioni affrontano, una a una, cinque 
delle principali tesi proposte da coloro che criticano il BL. 


Adulti e bambini 


Da quando Alleyne (1971) ha sollevato la questione, a 
molti non è sembrato plausibile che la stragrande 
maggioranza delle persone di una colonia di piantagioni 


debba aver perseverato nel parlare un pidgin privo di 
struttura per i molti decenni necessari perché il loro 
numero eguagliasse quello dei nativi del posto. Ma ora che 
Roberts (senza data) ha creato un database di oltre duemila 
citazioni delle varie lingue di contatto parlate alle Hawaii a 
partire dagli anni ottanta del settecento, c’é abbondante 
evidenza empirica del fatto che ciò che sembrava bizzarro 
ad Alleyne e altri è semplicemente quello che accade 
quando degli adulti privi di una lingua comune devono 
comunicare tra loro. 

Il pidgin inglese parlato alle Hawaii negli anni a cavallo 
tra il 1910 e il 1920, tre o quattro decenni dopo l’inizio 
dell’immigrazione di massa, quando i primi parlanti di 
creolo avevano raggiunto o stavano per raggiungere la 
maturità, non era più quel pidgin inglese regolare, 
strutturato o espanso parlato negli ultimi anni del 
diciottesimo secolo. Tra gli esempi tipici ci sono i seguenti 
(tutte evidenze riportate alla lettera e provenienti dai 
registri dei tribunali): 


1. What matter you speak buy wine Japanese store, 
then me lele pelekia (1911). 

2. Me buy, me go house kaukau kela opiuma shit 
(1911). 

3. You license no all same name? (1913). 

4. Long time shoe no finish (1914). 

5. He son-a-bitch, no good. I fix him, by and by fix 
(1915). 

6. Chong Chin strong man he hanapaa over there, 
neck liilii koe make no (1917). 

7. Yes, no can help, no can hide (1918). 


Dopo il 1920, sempre più immigrati acquisirono come 
seconda lingua, con diversi gradi di successo, il creolo 
emergente (questo molto prima che i parlanti nati in loco 
raggiungessero la parità numerica con gli immigrati). 


Quelli arrivati prima del 1920 continuarono a usare il 
pidgin variabile e in pratica privo di sintassi per il resto 
della propria vita. (Esempi dai primi anni settanta vengono 
dati da Bickerton e Odo 1976; Bickerton 1981). 

E vero che nel Pacifico Occidentale la lingua tok pisin, 
quella beach-la-mar e altri pidgin svilupparono delle 
strutture sistematiche che si avvicinavano a quelle di una 
lingua naturale completa con (apparentemente) poco o 
addirittura nessun contributo da parte dei bambini. 
Tuttavia, in questi casi, i processi durarono diverse 
generazioni. Inoltre c'erano delle condizioni assenti alle 
Hawaii o in altre colonie di piantagioni: i parlanti avevano 
lingue di sostrato simili e continuavano a vivere nelle 
proprie terre d'origine, nelle quali quelle lingue erano ben 
presenti e prosperavano. Di conseguenza, possiamo 
assumere che la maggior parte dei parlanti del Pacifico 
Occidentale fossero degli adulti bilingui fluenti, per i quali 
la lingua dominante era quella dei propri antenati - il che 
aveva reso possibile dei trasferimenti massicci dalle lingue 
di sostrato. Non possiamo fare la stessa assunzione per le 
Hawaii. Come si mostrerà, abbiamo indicazioni del fatto 
che la competenza dei bambini nelle lingue di sostrato 
fosse troppo limitata perché padroneggiassero qualcosa di 
più delle strutture più semplici (ammesso che lo facessero). 

Alle Hawaii, l’unico gruppo in cui si evidenzia 
un'influenza consistente e significativa da parte del 
sostrato era quello cresciuto di proposito come gruppo di 
individui bilingui con il giapponese come lingua dominante. 
Questo gruppo, noto come il kibei, era formato da 
giapponesi nati alle Hawaii che però, di solito tra i cinque e 
i nove anni, venivano mandati a completare la propria 
educazione in Giappone. Al loro ritorno alle Hawaii, i kibei 
parlavano una varietà di CIH che mostrava delle forti 
influenze di giapponese in aspetti non secondari quali 
l'ordine SOV delle parole, la relativa con la testa alla fine e 
le clausole avverbiali (Bickerton 1977) - delle 


caratteristiche che altrove si trovano solo in maniera 
sporadica nella versione parlata del giapponese piu vecchio 
e tradizionale. Il fattore decisivo, naturalmente, è la 
scoperta empirica fatta da Roberts (1998) che, alle Hawaii, 
tipicamente le forme e le strutture del creolo provenivano 
solo da individui nati lì, per la maggior parte descritti in 
modo esplicito da chi ne parlava come «bambini» o 
«adolescenti». 

L'unica giustificazione per il mantra adottato da DeGraff 
(1999) e molti altri dopo di lui - «Gli adulti innovano, i 
bambini regolarizzano» - sta nel fatto che alcune parole 
tipiche del creolo (per esempio, i marcatori TMA bin e go o 
il marcatore di scopo fu che viene dall’inglese for) erano 
usate, per quanto in maniera occasionale e non predicibile, 
dai parlanti di pidgin. È inevitabile che i parlanti di creolo 
usino il lessico del pidgin: devono pur prendere le parole da 
qualche parte. Ma i parlanti di pidgin non usavano mai bin 
come un marcatore del passato/trapassato prossimo 
piuttosto che del passato semplice o go come un marcatore 
dell’irreale piuttosto che come semplice marcatore di una 
sequenza di eventi. Inoltre, a livello della struttura e non 
delle singole parole, non c’è alcuna «innovazione da parte 
degli adulti». Tre strutture che non si trovano mai tra i 
parlanti immigrati sono: le subordinate relative (8), le 
subordinate finali con verbi al modo finito introdotte dal 
for/ fu (9) e i pronomi di ripresa obbligatori con soggetti dal 
riferimento indefinito (10) ((8)-(10) sono tutti esempi 
attestati). Eppure, tutte e tre le strutture vengono usate di 
frequente dai parlanti di creolo: 


8. The guy gon’ lay the vinyl been quote me price. 
«Il ragazzo che stava posando il vinile mi aveva 
fatto una stima del prezzo». 

9. More better for I write the answer. 

«E meglio che io scriva la risposta». 
10. Plenty old Hawaiians they do that. 


«Molti vecchi hawaiani erano soliti farlo». 


In altre parole, i bambini non avevano nulla da 
«regolarizzare». Innovavano e regolarizzavano allo stesso 
tempo, senza l’aiuto degli adulti. 

A sostegno di un modello del creolo in cui gli adulti hanno 
un ruolo preminente è stato portato il presunto fatto che 
nelle colonie di piantagioni (Haiti era quella a cui si è fatto 
riferimento più spesso) i bambini fossero troppo pochi per 
creare una lingua che potesse essere usata dall’intera 
comunità (tra gli altri, si vedano Goodman 1985; Singler 
1986). Sulla base di uno studio dei documenti originali di 
censimenti francesi che si trovano a Aix-en-Provence, 
Bickerton (1990a) ha mostrato che all’inizio della storia di 
Haiti il numero dei bambini sotto i dodici anni non fu mai 
inferiore al 20 per cento della popolazione totale. (In effetti, 
all’inizio della colonizzazione del Suriname, il numero più 
basso riscontrato fra tutte le colonie di piantagioni è stato il 
13,8 per cento). Per farsi un’idea, si consideri che il World 
Factbook della CIA stima l’attuale popolazione di bambini 
sotto i quattordici anni attorno al 20,2 per cento della 
popolazione totale degli Stati Uniti. Nonostante questi fatti, 
Lefebvre (1995, p. 259) ha continuato a insistere che «c’era 
una quasi totale assenza di riproduzione nella popolazione 
nel periodo critico». 

Questi fatti supportano qualcosa che è ovvio per 
chiunque, anche inesperto di questi problemi, abbia avuto 
l'occasione di mettere a confronto le abilità linguistiche 
degli adulti e quelle dei bambini. Costoro avranno notato 
per esempio che, se un genitore e un bambino si 
trasferiscono in un’area in cui si parla una lingua straniera, 
nella stragrande maggioranza dei casi il bambino acquisirà 
quella lingua molto più in fretta e in maniera più completa 
rispetto al proprio genitore. Dati provenienti dalle Hawaii 
mostrano che questa differenza nella capacità di 
apprendere è di gran lunga superata dalle differenze nella 


capacità creativa. In qualsiasi società delle piantagioni ci 
saranno stati degli individui nativi che parlavano una lingua 
umana completamente sviluppata, mentre la maggior parte 
degli adulti nati altrove stava ancora lottando per stabilire 
un mezzo di comunicazione fruibile. In queste circostanze è 
inevitabile che quanti erano nati altrove tentassero di 
imitare i nativi e apprendessero come seconda lingua una 
qualche versione (più o meno corretta) della nuova lingua 
creola. Questo è ciò che successe alle Hawaii quando la 
prima generazione di parlanti di creolo divenne adulta (per 
quanto costoro rappresentassero ancora una piccola 
minoranza della popolazione complessiva). In assenza di 
indicazioni contrarie, dobbiamo assumere che processi 
simili si siano verificati anche in altre comunità delle 
piantagioni. 

Nonostante tutte le evidenze empiriche indichino che 
siano stati i bambini (e non gli adulti) a dare origine al 
creolo, e solo congetture di natura teorica supportino la 
tesi contraria, la convinzione che le lingue creole siano 
state create in gran parte dagli adulti si è diffusa e 
rafforzata di recente (si vedano, per esempio, tra gli altri, 
Mather 2006; Plag 2008a, 2008b; Siegel 2009). Il 
fondamento principale su cui si basa questa convinzione 
sono le somiglianze tra strutture presenti nelle lingue di 
sostrato e nelle lingue creole. 


L'influenza delle lingue di sostrato 


l'esistenza di qualunque genere di GU vincola la forma 
complessiva che le lingue possono assumere. Forse è meno 
ovvio, per quanto sia altrettanto vero, che anche una GU 
ridotta all’osso come quella descritta in queste pagine 
vincola in una misura sorprendente la forma che il 
linguaggio può assumere. Certo, ciò che una GU di questo 
tipo lascia non-specificato produce una grande variazione 
tra le lingue, ma gran parte di quella variazione è 


localizzata in certe aree particolari della grammatica, e la 
quantita di modi per riempire gli spazi lasciati vuoti é 
piuttosto limitata. Cio significa che anche coppie scelte a 
caso di lingue tipologicamente simili (per esempio, le 
lingue isolanti) mostreranno con ogni probabilita alcune 
corrispondenze quasi perfette. 

A prima vista, il numero delle corrispondenze tra le 
lingue creole e i loro sostrati potrebbe sembrare troppo 
alto per essere considerato soltanto una coincidenza. 
Tuttavia si dà anche il caso che, a parte quelle dell'Oceano 
Indiano (mauriziano, seselwa) e CIH, tutte le lingue creole 
hanno avuto come sostrato per lo più una lingua dell’Africa 
occidentale. Nella letteratura sulle lingue creole, 
generalmente si assume che le lingue dell’Africa 
occidentale abbiano una struttura relativamente omogenea. 
Purtroppo i linguisti africanisti non la pensano allo stesso 
modo. 

Considerate quelle che spesso vengono ritenute i fiori 
all'occhiello dell’argomentazione dei sostratisti: le 
costruzioni di verbi seriali (CVS; per esempio, Sebba 1987; 
McWhorter 1992; Migge 1998). Esempio tipico 
dell’approccio sostratista è McWhorter (1997, pp. 154-55), 
il quale afferma: «I verbi seriali sono tipici delle lingue 
creole dei Caraibi per via della loro predominanza nelle 
lingue dell’Africa occidentale ... Tutti i parlanti africani, in 
un dato contesto, si sarebbero abituati a generare ed 
elaborare la lingua facendovi ricorso» (corsivo mio). 

Tuttavia uno specialista di una lingua africana 
(Dimmendaal 2001, p. 382) esprime così il proprio 
disappunto: «Una visione stereotipata delle lingue africane 
che s’incontra talvolta nella letteratura generale è che in 
esse siano presenti delle costruzioni di verbi seriali. In 
realtà questo fenomeno ha una diffusione abbastanza 
limitata, sia per quanto riguarda gli aspetti genetici sia per 
quanto riguarda quelli geografici. Si riscontra in una certa 
zona, che comprende aree per lo più contigue che vanno 


dalla Costa d’Avorio alla Nigeria, nelle lingue parlate da 
diversi sottogruppi del niger-congo: kwa, benue congo 
dell’ovest e ijoid». Alla luce di queste affermazioni, 
considerate il fatto che «le roccaforti dello schiavismo 
europeo e le piazze di commercio degli schiavi si 
estendevano da Capo Verde, nel Senegambia, a sud fino a 
Benguela, nella regione dell'Angola» (Richardson 1992, p. 
65). Ciò significa che le aree che erano bacino di raccolta 
degli schiavi comprendevano quelle abitate dai parlanti di 
bambara, wolof, hausa, fulani, kikongo, lingala e molte altre 
lingue niger-congo e bantu che non serializzano. 

Non abbiamo a disposizione i profili demografici completi 
che descrivono la provenienza degli schiavi attraverso il 
tempo per ciascuna delle colonie caraibiche, perciò è 
impossibile determinare la quantità dei parlanti di lingue 
con CVS in ogni momento o in ogni luogo. Tuttavia è 
altamente improbabile che essi fossero sempre e ovunque 
quelli predominanti; mentre è altamente probabile che in 
molte aree fossero predominanti i parlanti di lingue senza 
CVS. Se le cose stanno così, è un mistero come dei parlanti 
di lingue CVS fossero riusciti a far adottare delle lingue 
CVS a dei parlanti di lingue non-CVS. 

Il mistero scompare nel momento in cui si riesce a 
dimostrare che esso sorge perché si basa su dei fatti che 
non sussistono. Tutte e tre le lingue creole che non hanno 
un sostrato proveniente dall'Africa occidentale possiedono 
o hanno posseduto delle CVS. Si è mostrato che il 
mauriziano e il seselwa, universalmente ritenuti privi di 
CVS (Bollee 1977; Corne 1977; Papen 1978; Muysken 
1988), hanno invece un’ampia gamma di CVS (Bickerton 
1989, 1996) di cui gli osservatori precedenti non si erano 
accorti, inspiegabilmente. Nelle sue prime fasi, CIH aveva 
dei seriali direzionali (V come, V go) (Roberts 2004, che 
cita fonti contemporanee). Il fatto che non ne abbia oggi 
non deve sorprendere alla luce del fatto che anche almeno 
un’altra delle lingue creole il cui sostrato proviene 


dell’Africa occidentale non ha CVS (si tratta del bajan 
parlato alle Barbados). Sia nel caso delle Hawaii sia in 
quello delle Barbados, la ragione più plausibile di ciò è 
l’alta influenza che l’inglese ha esercitato in entrambe le 
isole, e non un qualche effetto prodotto dal sostrato. 

Questo non ha comunque impedito ad alcuni studiosi di 
far risalire varie caratteristiche di CIH all’influenza del 
sostrato. Siegel (2000, 2007), sulla scorta dei suggerimenti 
contenuti nei lavori precedenti di Roberts, ha proposto che 
l’uso che CIH fa sia in senso possessivo sia in senso 
esistenziale di get provenga dalla presenza di verbi simili 
nel sostrato (il cantonese yauh, l’hakka ju, il portoghese 
ter, l'hawaiano he o loa’a). Roberts (2004, p. 254) propone 
poi che l’espressione di CIH «no mo(re)», un 
possessivo/esistenziale negativo - 


11. Us nomo money. 
«Non abbiamo più soldi». 


- derivi da un verbo del cantonese, mouh, che ha un 
significato simile. Siegel (2000) ha portato l’attenzione su 
una copula locativa del cantonese, hai, che è il parallelo di 
stay in CIH - un verbo che sia Reinecke e Tokimasa (1934) 
sia Knowlton (1967) hanno ritenuto provenisse dal 
portoghese estar. Anche l’uso di stay come marcatore 
dell'aspetto imperfettivo viene visto come qualcosa che 
deriva tanto dal portoghese estar + verbo quanto dal 
cantonese hai/haidouh, per non parlare dell’hawaiano noho 
(Roberts 2004, pp. 257-58). Analogamente, Siegel (2007) 
sostiene che gli altri due marcatori TMA, been e go, 
corrispondano (rispettivamente) agli usi portoghesi di ter e 
ir. Si dice che il complementatore finale for derivi 
dall’hawaiano no/na e/o dal cantonese waihjo e/o dal 
portoghese para (Roberts 2004, pp. 260-61); e una fonte 
per il suo uso con frasi transitive e soggetti al nominativo 
(come in (9)) è stata individuata da Siegel (2007) in una 


costruzione al congiuntivo del portoghese. I seriali 
direzionali del tipo verbo + come o go, prima frequenti tra i 
bambini ma oggi rari o assenti, vengono attribuiti da 
Roberts (2004, p. 262) a una costruzione seriale del 
cantonese - di fatto, la studiosa si spinge anche più in là, 
suggerendo che l’origine di us, il nominativo per la prima 
persona plurale in CIH, sia nel dialetto del 
Northamptonshire (p. 268). 

Quello che sia Siegel sia Roberts non dicono è che tutte 
queste caratteristiche si ritrovano in molte lingue creole in 
giro per il mondo. Lesistenziale possessivo get (o i suoi 
equivalenti in francese o portoghese) si ritrova in guyanese, 
haitiano, papiamento e saotomense (Bickerton 1981, pp. 
66-67). Un possessivo o esistenziale negativo, napa - 
parallelo esatto di nomo -, si trova anche nelle lingue 
creole dell'Oceano Indiano (Corne 1988, 1995). Il morfema 
de (oggi contratto in e nel suo senso aspettuale) è usato, 
come stay, sia per esprimere l’aspetto [-compiuto] sia la 
copula locativa in sranan tongo. Un complementatore finale 
derivato da for si ritrova praticamente in tutte le lingue 
creole inglesi e i suoi equivalenti si ritrovano nella maggior 
parte delle lingue creole francesi e portoghesi (che usano 
versioni ridotte di pour o para, rispettivamente) (Bickerton 
1984b); le clausole finali di cui è testa di solito contengono 
verbi di modo finito, come in CIH - il che è in contrasto con 
le strutture infinitive equivalenti proprie di tutti e tre i 
lessificatori. La presenza di seriali direzionali è stata 
riportata in molte delle lingue creole dei Caraibi. In tutti 
questi casi si fa ripetutamente appello alle origini nel 
sostrato africano, ma naturalmente i casi corrispondenti in 
CIH non vengono mai menzionati - proprio come non si fa 
mai parola dei casi africani quando si discute di CIH. 
Chiaramente, è venuto il momento che i sostratisti 
dell'Atlantico e quelli del Pacifico inizino a parlarsi davvero. 

Se le forme che Roberts e Siegel pongono alla nostra 
attenzione venissero realmente dalle lingue di sostrato, ci 


Si aspetterebbe di trovarle nella produzione linguistica 
degli adulti con una perfetta padronanza di quelle lingue. E 
dunque senz’altro degno di nota che nessuna di queste 
forme compaia in qualcuno dei database di Roberts che 
raccolgono le citazioni di adulti non nativi. Forse il caso pit 
lampante é quello della presunta derivazione di stay e delle 
sue funzioni dal portoghese estar. Citando Reinecke e 
Tokimasa (1934), Smith (1939) e Carr (1972), Siegel (2007) 
sostiene che c’é un «generale accordo» sul fatto che questa 
derivazione sia corretta. Come tutti gli altri, scorda di dire 
che stay non é entrato nel vocabolario delle Hawaii fino a 
dopo il 1900 - data prima della quale il locativo del pidgin 
inglese delle Hawaii era stop. (Alcuni dei miei informatori 
più anziani usavano stop ancora negli anni settanta). Dal 
momento che, a partire dal 1900 e per circa un quarto di 
secolo, c'erano molti portoghesi alle Hawaii, è sicuramente 
degno di nota che, per tutto quel tempo, non ci sia traccia 
dell'uso di stay da parte di nessuno dei parlanti 
madrelingua di portoghese alle Hawaii (né da parte di 
chiunque abbia imparato il portoghese da loro). Inoltre stay 
non viene citato da nessuna parte come marcatore 
dell'aspetto prima del 1920, e viene descritto in Roberts 
(1998) come una chiara innovazione da parte dei nativi. 

Questo fa sì che l’unica opzione rimasta per descrivere il 
modo in cui estar avrebbe potuto influenzare stay sia che 
questo sia avvenuto per opera dei parlanti bilingui di 
portoghese e CIH. Vedremo più avanti quanto ciò sia 
improbabile. Il fatto che i sostratisti non riescano ad 
affrontare delle circostanze scomode come queste 
suggerisce che la teoria del sostrato non è in grado di 
metterci a disposizione una teoria coerente della 
creolizzazione. 


Creolizzazione «graduale» 


Lidea che le lingue creole evolvano in maniera graduale 
nell’arco di diverse generazioni ha un sostegno ampio, ma 
non totale (Arends 1989; Plag 1995; Mather 2006; ma si 
veda Smith 2006). Tuttavia la valutazione delle evidenze 
disponibili richiede molta più attenzione di quanta ne 
abbiano mostrata coloro che sostengono la tesi della 
gradualità. 

In primo luogo, le date delle prime citazioni vengono 
confuse con le date di origine. Assumendo un approccio di 
tipo storico, Baker (1995) usa le date delle prime citazioni 
per mostrare che i pidgin e le lingue creole non sono 
distinguibili e che lo sviluppo di queste ultime è spesso 
durato un secolo, o anche di più. Egli, però, ignora il fatto 
che vi è certo un intervallo di tempo tra il primo uso e la 
prima citazione, un intervallo inevitabile e piuttosto lungo. 
Per esempio, non esistono testi in sranan tra il 1718 e il 
1767; perciò una caratteristica della lingua sranan che si 
fosse originata all’incirca all'epoca del primo documento, 
ma comunque troppo tardi per poter comparire in esso, 
avrebbe dovuto attendere almeno mezzo secolo prima di 
essere attestata. Egli ignora l’infelice concomitanza di tre 
fatti riguardo ai primi testi e al loro contenuto: che 
praticamente tutti erano stati scritti da parlanti non 
madrelingua, che molti erano brevi e che in ogni lingua 
tutte le caratteristiche variano per frequenza - il che vuol 
dire che è molto meno probabile trovarne alcune piuttosto 
che altre, soprattutto in testi brevi. (Tra queste vi sono le 
combinazioni di due o tre marcatori TMA che nei testi 
creoli compaiono invariabilmente più tardi rispetto a un 
marcatore singolo). Considerati questi problemi, le date 
delle prime citazioni semplicemente non offrono una 
testimonianza adeguata del ritmo dello sviluppo storico. 

In secondo luogo, si fa confusione tra i cambiamenti 
specifici implicati dalla creolizzazione e quelli che 
coinvolgono il normale cambiamento intergenerazionale del 
linguaggio. Le lingue creole sono lingue naturali e, in 


quanto tali, sono soggette a un «normale» cambiamento al 
pari di tutte le altre. La maggior parte delle evidenze, se 
non tutte, mostra delle modificazioni che o alterano le 
caratteristiche gia esistenti oppure producono dei modi 
alternativi di esprimere concetti gia espressi in altro modo. 
(Si veda Bickerton 1991 per alcuni casi dettagliati in 
risposta nello specifico alle argomentazioni di Arends 
1989). In questo caso, semplicemente, le lingue creole 
usano un doppio standard. Linglese è cambiato in modo 
considerevole dal diciassettesimo secolo (quando si è 
originata la maggior parte delle lingue creole), ma nessuno 
ha mai sostenuto che la lingua parlata nell’Inghilterra del 
diciassettesimo secolo non fosse già l’inglese vero e 
proprio. 

Quella che potrebbe sembrare l’evidenza più diretta a 
favore della gradualità, proposta da Roberts (2000, 2004), 
verrà discussa ampiamente più avanti. La tesi di Roberts 
non poggia su alcun dato linguistico, ma solo sulla 
convinzione che un bambino non possa avere due lingue- 
madri. Eppure, praticamente tutti gli studiosi nel campo 
dell’acquisizione della lingua accettano che ci possa essere 
più di una lingua-madre. Infatti il termine «nativo bilingue» 
(Guthrie 1984; Thorn e Gathercole 1999; Tse 2001) è 
consueto nella letteratura sull’acquisizione della seconda 
lingua - e d’altra parte Meisel (2004, p. 95) lo afferma in 
maniera decisa: «L'idea più importante che abbiamo 
ricavato dagli studi condotti negli ultimi venticinque anni 
sul bilinguismo nei bambini è forse che l’acquisizione 
simultanea di due o più lingue si può effettivamente 
qualificare come un caso di acquisizione di più di una prima 
lingua». 

In breve, non c’è supporto empirico a sostegno della tesi 
che la genesi delle lingue creole sia multigenerazionale o 
anche bigenerazionale. Una genesi monogenerazionale è 
inevitabile, se la GU e l'acquisizione della lingua sono come 
le ho descritte qui. Resta da chiarire quale sia l’insieme di 


assunzioni, sempre che ce ne sia uno, da cui discendono le 
alternative. 


Negazione del pidgin 


La credenza che il pidgin non abbia sempre (0 non abbia 
mai) preceduto direttamente e originato le lingue creole 
mette insieme una gran varieta di studiosi che, talvolta, 
sostengono posizioni diametralmente opposte in merito ad 
altre questioni. Secondo Lefebvre (1986, p. 283), il quale 
crede che l’haitiano sia basato sul sostrato, «non va 
postulata nessuna fase pidgin che preceda il creolo»; e 
questo modo di vedere le cose è condiviso da DeGraff 
(2003), il quale considera l’haitiano un dialetto del 
francese. Nel loro tentativo di «decostruire» le lingue 
creole Ansaldo e Matthews (2007), senza arrivare 
all’esplicita negazione dell’esistenza di pidgin precreoli, la 
sottintendono quando rifiutano ogni «interruzione nella 
trasmissione» tra lingue creole e lingue antecedenti. 

Purtroppo, nell'unico caso in cui, sulla base di una 
quantità massiccia di dati molto dettagliati, sappiamo 
esattamente che cosa abbia preceduto in maniera diretta 
una lingua creola, abbiamo evidenze abbondanti del fatto 
che si trattasse di un pidgin privo di struttura. Inoltre, 
contro la credenza che il pidgin sia sempre figlio di un 
qualche lessificatore particolare (pidgin inglese, pidgin 
francese, e così via), questo aveva un vocabolario molto 
maccheronico (Roberts 1998, 2004, senza data) - cioè un 
vocabolario con parole prese da molte lingue diverse. 
Lobiezione che le altre lingue creole non mostrano alcuna 
evidenza di una fase di questo tipo è priva di fondamento. 
l'esistenza di un baragouin - parola francese di origine 
bretone che significa «gergo» O «linguaggio 
incomprensibile» - che ha preceduto le lingue creole delle 
Antille francesi è ben attestata (Wylie 1995). Nella 
prossima sezione incontreremo una quantità di parole in 


una varieta di lingue creole che sono senza dubbio dei 
fossili di un pidgin precreolo. Vanno nella stessa direzione 
molte delle primissime attestazioni delle lingue creole, 
come Herlein (1718) - un testo che assomiglia a qualcosa 
prodotto da qualcuno che abbia appreso lo sranan come 
seconda lingua - o le primissime citazioni di mauriziano (il 
creolo delle Mauritius) in Chaudenson (1981). Ulteriori 
evidenze indirette si possono trovare nel vocabolario 
estremamente variegato (e pieno di omonimi) delle lingue 
creole del Suriname, un dato poco notato ma molto 
significativo, le cui implicazioni sono discusse più avanti. 
Queste evidenze sono compatibili con ciò che si è trovato 
in quei pidgin che non si sono mai sviluppati in lingue 
creole (Bickerton 1999). Le fonti lessicali delle parole del 
pidgin di cui abbiamo le testimonianze più antiche, la 
lingua franca del Mediterraneo, variavano 
considerevolmente nel tempo e nello spazio (Schuchardt 
1980). Il russonorsk contiene non solo parole russe e 
norvegesi, ma anche parole provenienti da molte altre 
lingue (Broch e Jahr 1984). Nonostante il nome, il gergo 
chinook prende dalla lingua chinook meno della metà del 
proprio vocabolario; il resto si divide tra francese, inglese e 
molte altre lingue indiane americane (Lang 2008). Il 
fanagalo, un pidgin dei minatori del Sudafrica, contiene un 
mix di parole inglesi, afrikaans e africane (soprattutto zulu) 
(Mesthrie 1989). Bakker (1989) descrive un pidgin che 
prese vita attraverso i contatti tra pescatori francesi e 
islandesi, sebbene molte delle sue parole siano di origine 
germanica, dal fiammingo al danese. I pidgin sono 
esattamente ciò che ci si aspetterebbe: piuttosto che 
tentativi frustrati di imparare una lingua, la maggior parte 
di essi sono semplicemente dei tentativi, portati avanti con 
ogni mezzo, di rendere possibile la comunicazione 
superando barriere linguistiche insormontabili. In quanto 
tali, è probabile che siano emersi in una forma priva di 
struttura e maccheronica ogniqualvolta grandi quantità di 


persone parlanti di lingue reciprocamente non 
comprensibili siano venute improvvisamente a contatto fra 
loro. 

Chi nega il pidgin assomiglia ai negazionisti 
dell'Olocausto e dei cambiamenti climatici, in quanto 
sembra in qualche modo capace di controbilanciare una 
montagna di prove empiriche con alcuni presunti fatti 
banali e irrilevanti, come quello che non ci sia 
sovrapposizione tra le aree in cui oggi si parlano i pidgin e 
quelle dove si ipotizza si parlassero in passato; o il fatto che 
il termine creolo in origine venisse usato per riferirsi a 
persone o animali e non a delle lingue; oppure il fatto che il 
termine pidgin sia venuto dalla Cina (Mufwene 2008, dove 
queste sono citate tra le ragioni per supporre che il ciclo 
pidgin-creolo sia un «mito» di cui i linguisti dovrebbero 
sbarazzarsi). A dirla tutta, gli articoli più importanti che 
intendono demolire interamente l’idea che ci sia un ciclo 
pidgin-creolo non fanno neppure menzione del caso delle 
Hawaii, figurarsi se lo discutono (Mufwene 2003, 2008; 
DeGraff 2005). Quando si fa riferimento alle Hawaii, lo si fa 
solo nel contesto di affermazioni di questo tipo: «Alle 
Hawaii, i missionari americani hanno insegnato l'inglese 
prima ai membri della famiglia reale, i quali sarebbero poi 
diventati utili come interpreti durante la colonizzazione e lo 
sfruttamento economico delle isole» (Mufwene 2009, p. 5). 
L'immagine della principessa delle Hawaii che risolve 
controversie tra i caporali della Carolina e i lavoratori 
cinesi è davvero molto suggestiva, per quanto il suo 
fondamento storico sia pari a zero, e ci fa capire fino a dove 
possono spingersi i negazionisti del pidgin. 


Differenze nel creolo 


La prima cosa da notare in questa sottosezione è la 
credenza piuttosto curiosa, a quanto sembra condivisa da 
molti studiosi delle lingue creole, secondo la quale, se ci 


fosse un programma biologico per il linguaggio, esso 
dovrebbe venire eseguito in maniera universale e senza 
eccezioni o modifiche; così, se una lingua creola qualsiasi 
deviasse dalle specificazioni del programma, ciò 
invaliderebbe automaticamente la sua esistenza. Anzi, «la 
metafora del programma genetico promuove l’idea che ogni 
punto di decisione nello sviluppo o nel comportamento, e 
ogni input ambientale, agisca sotto direttiva della genetica 
o di un insieme di regole genetiche del tipo “nella 
condizione X, fai A” oppure “nella condizione Y, fai B”. Ma 
nel genoma non ci sono regole di questo tipo, solo un 
insieme di modelli per le molecole che diventeranno parte 
del fenotipo. Il comportamento di quelle molecole dipende 
tanto dalla natura dei materiali forniti dall'ambiente che le 
compongono quanto dal modello genetico che contribuisce 
alla loro organizzazione» (West-Eberhard 2003, pp. 14-15). 
Alla base di molte critiche rivolte all'approccio 
universalista c'è semplicemente una mancata 
comprensione di come funziona la biologia. Il «modello 
genetico» non può neppure cominciare a operare in 
assenza «dei materiali forniti dall'ambiente» - e cioè le 
parole -, poiché la GU ridotta all’osso descritta nel capitolo 
5 deve interagire con del materiale lessicale di un qualche 
tipo. In circostanze di normale trasmissione da generazione 
a generazione, i materiali forniti a livello ambientale sono 
abbondanti e sufficienti a produrre la vasta, per quanto 
tutt'altro che illimitata, diversità delle lingue umane. Nelle 
circostanze proprie delle colonie di piantagioni, quei 
materiali erano sia più radi sia più contrastanti, e il 
contributo che potevano offrire all’apprendimento da parte 
del bambino era ridotto. I bambini avevano a disposizione 
gli algoritmi per la costruzione dei sintagmi e delle clausole 
che facevano parte del loro patrimonio linguistico, ma non 
potevano ricostruire in maniera affidabile il sistema di 
nessuna lingua precedente per specificare quelle aree della 


grammatica che questa GU ridotta all’osso aveva lasciato 
sotto-specificate. 

Questo e il punto in cui la teoria che propongo si 
distanzia dai modelli precedenti. Il bioprogramma 
originario (Bickerton 1981, 1984b) non si sbilanciava su 
come andasse intesa esattamente la componente innata. 
Limplicazione era che il bioprogramma, al pari delle sue 
controparti generative, specificasse, se non tutta la 
grammatica, almeno una gran parte di essa. Questo 
lasciava ancora spazio per delle variazioni nelle 
caratteristiche del creolo. Il concetto di «continuum tra le 
lingue creole» elaborato in precedenza sarebbe stato 
ancora valido: le diverse caratteristiche del sostrato e del 
lessificatore accessibili in ciascuna situazione avrebbero 
causato inevitabilmente delle differenze nelle lingue 
risultanti, man mano che i bambini provavano a sostanziare 
quelle strutture ridotte all’osso, che erano tutto quanto la 
GU gli aveva dato in dotazione. 

In un contesto di creolizzazione, i bambini avrebbero 
utilizzato soprattutto quel materiale frammentario per 
riempire gli spazi lasciati vuoti da una GU incompleta. Il 
creolo doveva avere un ordine delle parole, che non era 
stato specificato; quindi avrebbero preso gli esempi a loro 
disposizione - e non sarebbero mai stati gli stessi in due 
posti diversi. Le lingue creole mostrano differenze più 
grandi nei sintagmi nominali che non nelle clausole (Kihm 
2008), poiché l’ordine di attacco della GU nelle frasi 
specifica già in parte la sequenza, mentre nei sintagmi 
questi vincoli non ci sono. Ma ricordate sulla scorta di 
quanto detto nel capitolo 6 che ci sono delle sotto- 
specificazioni a cui si deve ovviare e delle sotto- 
specificazioni a cui si può ovviare. 

Perciò, nelle lingue creole esistono due fonti di 
variazione. Una, che proviene dal continuum tra le lingue 
creole, è la variazione nella ricchezza (o altro) del materiale 
proveniente da altre lingue che è disponibile al bambino - il 


che conduce molto spesso alle variazioni nella vicinanza di 
una data lingua creola al proprio lessificatore principale. 
L'altra, non considerata nelle trattazioni precedenti, 
consiste nelle strategie adottate per rimediare alle sotto- 
specificazioni del secondo tipo. Questo risulterà più chiaro 
se consideriamo alcuni dei rimedi particolari che sono stati 
adottati. Due di questi riguardano i pronomi interrogativi e 
i sistemi TMA. 

A quanto pare, le lingue debbono avere dei sistemi TMA e 
dei pronomi interrogativi: nessuna lingua ne è del tutto 
priva. Eppure, essi differiscono ampiamente per forma e 
funzione nelle diverse lingue - nel caso dei sistemi TMA, le 
differenze sono significative perché sono molto poche le 
lingue (al di fuori di quelle creole) che hanno sistemi 
identici. L'essenza di queste cose deve essere innata in 
qualche senso. È difficile immaginare una lingua che non 
abbia un modo per indicare se i proferimenti siano delle 
affermazioni o delle domande e, nel caso di queste ultime, 
che cosa si stia chiedendo esattamente. È difficile 
immaginare una lingua che manchi di mezzi per esprimere 
le tempistiche relative o la realtà degli eventi. Ma è ancora 
più difficile dire esattamente in che modo o per quale 
motivo queste cose siano innate. Sembra che ci sia un 
insieme di presupposizioni umane nel linguaggio e che 
questo insieme sia una proprietà emergente del tipo di 
cognizione generale di cui disponiamo. Tuttavia esistono 
molti più modi di costruire un sistema TMA di quanti ne 
esistano di costruire i pronomi interrogativi. Se vanno persi 
i pronomi interrogativi originari, non c'è un modo semplice 
per rimpiazzarli che non sia quello di scegliere un singolo 
morfema che significherà semplicemente D - «Questa è una 
domanda!» -, seguito da un’altra parola che specifichi di 
che genere di domanda si tratti: una locazione per le 
domande sul «dove», un termine generico che indichi la 
persona (o le persone) per le domande sul «chi», e così via. 
Tutte le lingue creole che non preservano i pronomi 


interrogativi del proprio lessificatore principale li 
rimpiazzano con dei pronomi interrogativi a due morfemi di 
questo tipo. 

Tuttavia le scelte su quale usare come parola-chiave per 
formulare la domanda e su che cosa usare come suo 
descrittore sono determinate solo dalla semantica nel suo 
complesso. «Chi», «che cosa», o «quale» possono essere 
usati per l'elemento D. Per il secondo elemento, le domande 
sul «dove» possono usare «lato» o «posto», quelle sul 
«quando» possono usare «tempo» o «ora», e così via. 
Anche tra lingue creole strettamente legate possono 
sorgere delle differenze. In sranan, «perché» è sanede 
(letteralmente: «cosa-testa»), mentre in saramaccano è 
andi-mbei (letteralmente: «che cosa fa»). 

Il sistema TMA è più complesso, sebbene si riscontri, 
oltre a un nucleo centrale comune a tutte, un’identita 
virtuale tra lingue creole completamente slegate tra loro - 
per esempio, il saramaccano, parlato in Suriname, e 
l’annobonese, parlato in un’isola dell’Africa occidentale 
(Bakker et al. 1995). Se assumiamo l’esistenza di vincoli 
cognitivi generali che generano il bisogno di esprimere il 
tempo, la realtà e la completezza delle azioni e degli eventi, 
questo sistema, che fa parte del nucleo della lingua, è il più 
economico possibile e produce tre marcatori (uno per ogni 
categoria semantica) e un totale di otto «tempi», poiché 
nessuna condizione limita la combinabilità. 

Le differenze relativamente piccole tra le lingue creole 
che si riscontrano in questo sistema hanno due cause. I 
bambini esposti a un pidgin proveranno a usare qualsiasi 
cosa trovino in esso. In seguito possono o meno incorporare 
questo materiale all’interno dei loro sistemi TMA. Nel 
pidgin inglese delle Hawaii c'erano due marcatori per la 
sequenza, baimbai e pau: il primo era usato sia per indicare 
il prossimo-in-una-sequenza sia per indicare degli eventi 
futuri; il secondo era usato per indicare eventi conclusi. 
(Pau significa «finire» nel vernacolo hawaiano). È fondato 


supporre che i marcatori dotati di queste funzioni ricorrano 
ripetutamente nei pidgin e che, in un certo numero di casi, 
essi vengano incorporati nelle lingue creole successive. Il 
marcatore per il prossimo-in-una-sequenza è chiaramente 
un candidato per esprimere il modo dell’irrealtà, mentre il 
marcatore per evento-concluso è un candidato naturale per 
esprimere l’aspetto compiuto. Alle Hawaii, nessuno dei due 
marcatori è stato incorporato nel sistema TMA del creolo, 
sebbene entrambi rimangano nella loro posizione originale 
alla fine di un sintagma o di una clausola sporadicamente 
usati con funzione di avverbi. 

Tuttavia altre lingue creole (comprese alcune che non 
sono lingue creole delle piantagioni) si comportano in 
maniera diversa. In tok pisin, baimbai è stato ridotto nella 
sua forma creola a bai ed è stato incorporato, e pinis (da 
finish, «finire») è stato incorporato ma lasciato dopo il 
verbo. Nelle lingue creole legate al portoghese o 
influenzate da esso, troviamo kaba (dal portoghese acabar, 
«finire») e lo(go) (dal portoghese logo, «successivamente, 
presto»). Nelle lingue creole legate al francese, abbiamo 
fini (dal francese fini, «finito»). Nelle lingue creole 
dell'Atlantico legate all’inglese, troviamo don (da done, 
«fatto/finito»). In papiamento, lo (forma ridotta di logo) è 
stato incorporato come marcatore dell’irreale, ma è rimasto 
a inizio frase. Nelle lingue creole del Suriname, kaba è 
stato incorporato come un marcatore dell’aspetto compiuto 
che ricorre in maniera sporadica, ma è rimasto in posizione 
finale. Nelle lingue creole legate al francese, fini, presente 
spesso in forma ridotta, è stato spostato nella posizione 
TMA canonica per competere con l’anteriore ti. Nelle 
lingue creole legate all’inglese, il destino di don è stato 
variabile. 

La seconda causa di deviazioni non ha nulla a che vedere 
con il processo di creolizzazione, ma riguarda il 
cambiamento linguistico successivo. Lo sranan moderno ha 
due marcatori per l’irreale: sa (o dal portoghese saber o 


dall’olandese zal) e (g) 0; ma secondo Winford e Migge 
(2007, p. 78), «tutte le categorie tempo-aspetto delle 
moderne lingue creole [del Suriname], fatta eccezione per 
il futuro (g) o, sono già ben consolidate nei primi testi». In 
altre parole, lo sranan ha in qualche modo assunto go dopo 
il processo di creolizzazione, e il fatto di avere due 
marcatori per l’irreale ha condotto alla divisione del 
significato, con (g) o e sa a marcare (rispettivamente) 
eventi più probabili o meno probabili. In modo analogo, il 
guyanese ha preso doz (da does, «fa») come marcatore di 
abitualità, creando un contrasto tra la varietà di guyanese 
più lontana dall’inglese (12) e quelle più vicine (13): 


12. ia wok haad. 
He is working hard («Sta lavorando/lavora 
duramente»). 
13a. ia wok/i wokin haad. 
He is working hard («Sta lavorando duramente»). 
b. idoz wok haad. 
He works hard («Lavora duramente»). 


Se mettiamo da parte i fossili del pidgin e i cambiamenti 
post-creolizzazione, l’unico elemento differenziale nei 
sistemi TMA del creolo è la misura in cui un contatto più 
esteso e/o intensivo con il lessificatore ha portato alla 
sostituzione dei marcatori tipici del creolo e delle categorie 
semantiche che essi rappresentano con forme e categorie 
del lessificatore principale. In altri termini, tali differenze 
sono il prodotto inevitabile di fatti inevitabili: le lingue 
creole devono prendere il proprio vocabolario da qualche 
parte, devono rimediare ad alcune delle sotto-specificazioni 
della GU e non ci sono due lingue creole che avranno 
esattamente lo stesso input proveniente dalle altre lingue. 
In nessun modo questi fatti possono costituire delle prove 
per rigettare l'approccio universalista alle lingue creole. 


Riassumendo, nessuna delle critiche mosse all’approccio 
universalista si è dimostrata valida. Ciò nonostante, 
ripetutamente, si è sostenuto che quell’approccio era stato 
confutato una volta per tutte. Ci si può solo chiedere su 
quali basi poggi una tale affermazione, dal momento che 
pochi che condannano il BL citano, e in pratica nessuno 
discute seriamente (figurarsi rispondere), una lunga serie 
di articoli (Bickerton 1984a, 1987, 1990a, 1991, 1992a, 
1994, 1995, 1996, 1999, 2006) nei quali ho già risposto a 
queste critiche e ad altre. 

Forse le due aree geografiche più importanti per lo studio 
delle lingue creole sono il Suriname e le Hawaii. Il 
Suriname è importante perché, a differenza di molti altri 
luoghi, non ha solo una ma molte lingue creole, e queste 
sono più lontane dal loro lessificatore principale (l’inglese) 
rispetto a ogni altra. Le Hawaii sono cruciali perché sono 
l’unica zona del mondo in cui abbiamo evidenze empiriche 
massicce non solo per il creolo in sé ma anche per gli stadi 
che l'hanno preceduto. Qui mostrerò come l’approccio che 
sto sostenendo sia in grado di rendere conto dei fenomeni 
presenti in queste due zone meglio di ogni altro approccio 
rivale. 


LO SRANAN E IL SARAMACCANO: 
ORIGINI COMUNI O INDIPENDENTI? 


I primi insediamenti in Suriname risalgono al 1651. 
Quarant'anni più tardi esso si divise in due comunità. Una, 
formata da proprietari di piantagioni e schiavi, sviluppò 
una lingua chiamata sranan. L'altra, formata dai cimarroni 
(schiavi scappati), sviluppò una lingua nota come 
saramaccano. Queste lingue sono così simili da un punto di 
vista grammaticale che praticamente tutti gli specialisti in 
questa area di studi hanno assunto che entrambe 
discendano da un'unica lingua creola (o, nel peggiore dei 
casi, da un pidgin stabilizzato e interamente sviluppato che 


era sulla buona strada per diventare una lingua vera e 
propria). Se pero nel 1690 c’era ancora soltanto un pidgin 
maccheronico e senza struttura, allora, per quanto le due 
lingue debbano essersi sviluppate a partire dallo stesso 
pidgin, la loro somiglianza nella struttura può emergere 
solo dal fatto che gli stessi fattori universali discussi in 
questo capitolo abbiano operato due volte, in maniera 
indipendente, per produrre in ciascun caso risultati molto 
simili, se non quasi del tutto identici. 

Evidenze a supporto del secondo modo di vedere le cose 
provengono da due fonti diverse. Una è la storia e il profilo 
demografico del Suriname a cavallo tra il 1651 e il 1690. 
L'altra è una comparazione tra i vocabolari dello sranan e 
del saramaccano, mai fatta prima d’ora. Queste due fonti 
sono complementari e suggeriscono che sranan e 
saramaccano sono nati separatamente e che le loro 
somiglianze strutturali sono una forte evidenza a favore 
della posizione universalista. 


La storia degli albori del Suriname 


Il Suriname è nato attorno al 1650 primariamente come 
colonia inglese dove stabilire fattorie, proprio come le 
Barbados, con un rapporto schiavi-liberi di 2:1. A partire 
dal 1667 è stato attraversato da una serie di eventi 
traumatici: un'invasione olandese terminata con una 
conquista, la perdita della maggior parte della propria 
popolazione originaria quando gli inglesi e i loro schiavi lo 
abbandonarono in massa, diverse pestilenze e attacchi da 
parte degli amerindi. Secondo Migge (1998, p. 221), «circa 
tra i tre quarti (anni settanta del seicento) e la metà (anni 
ottanta del seicento) della popolazione totale di schiavi ... 
era morta o aveva lasciato la piantagione». Nel periodo che 
va dal 1680 al 1700, l’arrivo di diciassettemila schiavi 
(Postma 1990) aveva portato a un aumento della 
popolazione di meno di ottomila unità (Arends 1995). 


Secondo Price (1976), una rivolta di schiavi del 1690 
nella piantagione di Machado (una delle piantagioni di 
proprieta dei portoghesi) diede il via a una divisione tra lo 
sranan (la lingua di coloro che rimasero nelle piantagioni) e 
il saramaccano (la prima delle molte lingue parlate da 
coloro che scapparono). Ma, non essendoci testi 
sopravvissuti, la situazione linguistica nel 1690 rimane 
sconosciuta. La storia dei decenni precedenti dà poco 
supporto alla ricostruzione di uno scenario qualsiasi degli 
inizi del processo di creolizzazione. Dal 1667 in avanti, i 
proprietari inglesi lasciarono la colonia insieme ai loro 
schiavi; ed entro il 1675 erano rimasti solo una cinquantina 
degli appartenenti alla popolazione di schiavi originaria. I 
proprietari olandesi tardavano ad approfittare della nuova 
colonia, e così nel 1679 c’erano ancora soltanto un migliaio 
di schiavi (contro i tremila di quattordici anni prima). 
Questo significa che gli schiavi in arrivo avevano a 
disposizione una finestra temporale estremamente ridotta, 
circa cinque o sei anni al massimo, per acquisire 
completamente qualsiasi lingua di contatto avessero 
sviluppato gli schiavi in partenza. Immediatamente dopo, 
gli schiavi arrivati da poco avrebbero dovuto trasmettere 
tutti i dettagli di quella stessa lingua di contatto agli schiavi 
in arrivo mentre (se le cifre di Migge 1998 citate sopra 
sono corrette) il loro numero diminuiva del 5-8 per cento 
ogni anno! Allo stesso tempo, questo gruppo di 
schiavi-«finestra» in rapida diminuzione continuava a 
essere sommerso dall’arrivo di immigrati sempre nuovi. 
Infatti, come osserva Arends (1995, p. 269), «nei primi 
cinquant'anni di colonizzazione, l’intera popolazione nera» 
(della quale gli schiavifinestra superstiti erano già una 
minoranza che si andava sempre più assottigliando) «era in 
inferiorità numerica rispetto a coloro che arrivavano 
dall'Africa ogni trecinque anni» (corsivo mio). Nessuna 
lingua di contatto - sia essa un pidgin stabilizzato, una 
versione del lessificatore appresa come seconda lingua o un 


creolo nascente - si sarebbe potuta preservare integra in 
mezzo a queste vicissitudini. Infatti l’unico risultato 
probabile è che quei pochi che potrebbero aver parlato 
qualche lingua di contatto preesistente sarebbero stati 
costretti ad abbandonarla per adottare lo stesso modo di 
comunicare informe creato ad hoc che i nuovi immigrati 
usavano per comunicare tra loro. 


Il lessico dello sranan e del saramaccano 


La norma per le lingue creole è prendere la stragrande 
maggioranza delle parole da una sola lingua. Per quanto in 
sranan e saramaccano le parole inglesi siano le più comuni, 
nel primo c’è una percentuale stranamente alta di parole 
prese da altre lingue, mentre nel secondo le parole inglesi 
non sono la maggioranza, ma solo una pluralità. La 
componente africana in saramaccano è molto nutrita: Price 
(1976) l’ha stimata attorno al 50 per cento, che può essere 
un’esagerazione ma, sorprendentemente, pare che 
nessun’altra stima sia stata prodotta in seguito. Entrambi 
prendono parole dall’inglese, dall’olandese, dal portoghese 
e da diverse lingue africane e amerindie. Degno di nota è 
poi l’alto numero di sinonimi. Di norma, le lingue creole 
riducono invece di aumentare la sinonimia; per esempio, le 
funzioni di «parlare», «dire», «raccontare» e così via sono 
raccolte in un unico verbo. Perché una singola lingua 
dovrebbe avere due parole per la stessa cosa, spesso 
addirittura due parole prese dalla stessa lingua? Un'analisi 
molto rapida dei due lessici indica che deve essere 
successo qualcosa di atipico rispetto alle lingue creole. 

In genere, sono i pidgin a essere maccheronici e non le 
lingue creole. Questa è una conseguenza naturale del fatto 
che i pidgin non sono né un tentativo venuto male di 
imparare una lingua dominante né un tentativo di 
rimarcare l’identità dei parlanti e differenziarli dai loro 
padroni - probabilmente, le due teorie più in voga su che 


cosa essi siano. Piuttosto, sono una negoziazione tra 
parlanti di lingue reciprocamente incomprensibili che 
stanno semplicemente cercando un modo per comunicare 
tra loro. Il processo mi è stato ben descritto da qualcuno 
che l’ha vissuto per davvero: «Così, usiamo l’hawaiano e il 
cinese insieme in una stessa frase. Vedi? E mi chiedono se 
questa è una parola hawaiana; e io gli dico: no, forse 
questa è una parola del giapponese che ci abbiamo messo 
dentro noi per fare una frase con una parola hawaiana. E il 
cinese lo stesso, per fare una frase per farti capire» (Rachel 
Kupepe, citata in Bickerton 1981, p. 11). Sostituite 
hawaiano, cinese e giapponese con fongbe, kikongo e 
portoghese, e probabilmente avrete un’idea abbastanza 
chiara di quello che stava accadendo in Suriname prima del 
1690. Alle Hawaii, la presenza continuata dell’inglese 
assicurava che questo stato di cose non si protraesse a 
lungo. Ma in Suriname l’inglese era stato rimosso, e così 
quello stato di cose proseguiva. 

Ci sono diversi studi che usano i lessici di una o di 
entrambe le lingue per analizzare la fonologia o 
determinare la provenienza delle singole parole (per 
esempio, Daeleman 1972; Smith 1987, 2008; Kramer 2002; 
Good 2009), ed esiste anche uno studio, pubblicato sotto 
forma di libro, che si occupa solo del primo vocabolario 
dello sranan senza indagare le questioni in esame qui 
(Braun 2009). A quanto ne so, non c’è al momento un solo 
studio comparativo del lessico del saramaccano e dello 
sranan. Ogni studio lessicale sulle differenze tra queste due 
lingue si incentra sul diverso apporto inglese-portoghese, 
supponendo che questa sia l’unica differenza che le 
contraddistingue: essa è dovuta al fatto che una 
percentuale considerevole dei parlanti originari del 
saramaccano veniva dalle piantagioni possedute dai 
rifugiati ebrei portoghesi. (Per una breve storia, si veda 
Goodman 1987). In realtà le alternative inglese-portoghese 


sono all’origine di meno di un terzo delle differenze tra le 
due lingue. 

Se le due lingue hanno un’origine comune recente (meno 
di quattrocento anni fa), e perciò possiedono qualcosa di 
simile a una grammatica comune, non ci si aspetterebbe di 
trovare una differenza di quasi il 50 per cento tra i due 
vocabolari. Ci si aspetterebbe di trovare ancor meno 
differenze negli elementi grammaticali effettivi attraverso 
cui si esprime la grammatica. Ma, come mostra la tabella 
8.1, queste differenze ci sono e sono molto diffuse. In alcuni 
casi esse non sono riconducibili alla scelta di parole 
provenienti da lingue diverse, ma all’aver scelto diverse 
parole all’interno della stessa lingua, l'inglese. Per 
esprimere l’aspetto imperfettivo, il saramaccano ha scelto 
ta, dall'inglese stand («stare»), mentre lo sranan ha scelto 
de, dall’inglese there («là») (Winford e Migge 2007); e, per 
«dove», il saramaccano ha usato una riduzione della parola 
inglese side («lato»), mentre lo sranan ha usato una 
riduzione della parola inglese place («luogo»). Dal 
momento che le funzioni grammaticali possono 
difficilmente esistere in assenza di parole-funzione che le 
esprimano, si può assumere solo che ciascuna lingua, a 
partire da diverse possibilità offerte da un pidgin altamente 
variabile, abbia fatto scelte diverse per quanto concerne i 
marcatori di molte funzioni grammaticali. 

Analogamente, se lo sranan e il saramaccano fossero 
derivati da un’unica lingua già sviluppata, non ci si 
aspetterebbe di trovare più di metà dei giorni della 
settimana e tutti i mesi dell’anno completamente diversi 
nelle due lingue. I quattro giorni che vanno dal lunedì al 
giovedì - munde, tudewroko, dridewroko, fodewroko nello 
sranan - sono fodaka, feifidaka, pikisaba, gaansaba in 
saramaccano. 


Sranan Saramaccano 
Articolo determinativo (d)a di 


(sing.) 


Articolo determinativo den dee 
(pl.) 
Aspetto imperfettivo (d)e ta 
Tempo anteriore ben bi 
Parole WH: 
chi suma ambe 
che cosa faa, san andi 
quando oten na unten 
dove (o)pe ka, naase 
quale sortu un 
perché sanede andimbei 
Pronomi: 
tu yu 1 
noi unu u 
Preposizioni: 
in ini a 
con psa langalanga 
dentro ini (sei) dendu 
sotto ondro basu 
Congiunzioni: 
e e, nanga ku 
se efu ee 


Tabella 8.1. Elementi grammaticali nello sranan e in saramaccano. 


I mesi in saramaccano sono particolarmente interessanti, 
dal momento che diversi di loro sono il riflesso delle attività 
o di certi stati di cose peculiari di una società della foresta 
pluviale; in altre parole, devono essere arrivati dopo la fuga 
dal sistema delle piantagioni: baimatuliba, luglio («mese 
spazza-foresta»); hondimaliba, giugno («mese del 
cacciatore»); sebitaaliba, maggio («mese della 
sanguisuga»); tanvuwataliba, agosto («mese in cui si 
aspetta l’acqua»). Da questo, e dal fatto che lo sranan 
aveva adottato direttamente i mesi dell’olandese, si può 
soltanto concludere che il pidgin originale del Suriname 


non avesse un nome per nessuno dei mesi e che i nomi del 
Saramaccano si siano sviluppati solo dopo il 1690 nella 
foresta pluviale dell’interno. 

Una lingua gia costituita di sicuro avrebbe anche avuto 
un accordo interno sui termini per esprimere i quattro 
punti cardinali. Ma, ancora una volta, lo sranan e il 
Saramaccano usano termini davvero diversi: noordsei, 
zuidsei, oostsei, westsei (parole composte che combinano le 
parole olandesi per i punti cardinali con l’inglese side, 
«lato») in sranan, di contro a basuse, libase, sonukumutu, 
sonugo (letteralmente «lato inferiore», «lato superiore», 
«sole-viene-fuori» e «sole-va») in saramaccano. La parola 
liba di per sé ci offre un indizio importante sui processi che 
hanno dato origine alle lingue creole del Suriname. In 
sranan, liba significa «fiume», che è chiaramente una forma 
sopravvissuta dell’inglese river. In saramaccano, «fiume» è 
lio, dal portoghese rio; liba significa «mese», «luna», 
«sopra a» e «cielo», ed è anche parte del composto 
libabuka bia, letteramente: «barba sopra alla bocca», e cioè 
«baffi». (Si noti che libase diventa «sud» perché la parte 
sud è quella dove si trovano l’altopiano e i corsi superiori 
dei fiumi del Suriname, mentre basuse indica il bassopiano 
situato a nord). Dal momento che il portoghese usa parole 
diverse per esprimere tutti i significati di liba (lua, «luna»; 
mes, «mese»; ceu, «cielo», e così via), ma non ha nessuna 
forma da cui possa essere derivato liba, l’unica origine 
possibile è lo spagnolo arriba, «sopra» - e ciò suggerisce 
che almeno alcuni degli «ebrei portoghesi» di fatto 
parlassero lo spagnolo. Ma se il saramaccano si fosse 
sviluppato da un creolo portoghese, o «jew-tongo» (Smith 
1987), come avrebbero potuto i suoi parlanti non conoscere 
direttamente le versioni portoghesi di elementi tanto 
basilari del vocabolario come «luna», «cielo» o «mese»? 

Differenze simili si trovano tra i vocabolari dello sranan e 
del saramaccano in tutto il lessico. Le parole per parte 
della più comune fauna tropicale sono diverse nelle due 


lingue - compresi i termini per «formica», «formichiere», 
«zanzara», «caimano», «avvoltoio», «aquila», «airone», 
«granchio», «ratto», «anatra», «lucertola», «centopiedi», 
«acaro» e «mosca». Relativamente poche di queste 
differenze coinvolgono l’etimo portoghese, e in un caso in 
cui questo avviene («lucertola»: kaluwa in saramaccano, 
lagadisi in sranan) è lo sranan, e non il saramaccano, che 
sceglie l’etimo portoghese lagarto. Di nuovo, contro ogni 
aspettativa, è qualche volta il saramaccano a preservare la 
parola derivata dall’inglese - per esempio, hansi, «formica» 
(dall’inglese ant), di contro a mira dello sranan 
(dall'olandese mier). Analogamente, sono diverse le parole 
per indicare molte parti del corpo - tra queste: «caviglia», 
«coscia», «gomito», «vita», «fronte», «collo», «ombelico», 
«pene», «vagina», «ano», «inguine», «teschio» œ 
«guancia». 

Forse, la caratteristica più degna di nota dei due 
vocabolari è l’alta percentuale di parole composte che 
hanno forme differenti per lo stesso significato. Le parole 
composte sono probabilmente il segno più affidabile che 
indica il momento in cui è stato raggiunto lo stadio del 
creolo. Tali parole tipicamente riempiono i vuoti del 
vocabolario del pidgin, quelli per cui non era disponibile 
nessuna parola di nessuna delle lingue in teoria a 
disposizione - inglese, portoghese, olandese e un numero 
indeterminato di lingue africane (per non menzionare 
quelle amerindie). Si noti anche che queste parole 
composte spesso si basano su due o anche tre lingue 
diverse - come per esempio agofutu wojo, «caviglia», che 
deriva da ago, «nodo» (la lingua d’origine è sconosciuta), 
futu, «piede» (dall’inglese foot), e wojo, «occhio», (dal 
portoghese olho). Questo suggerisce che, almeno fino alla 
divisione tra sranan e saramaccano, il vocabolario 
complessivo del Suriname fosse estremamente ristretto 
quanto a copertura semantica, ma abbastanza ricco per ciò 
che concerne lo stock di parole comuni sinonime ricavate 


da varie lingue - proprio il genere di cosa predetta dalla 
spiegazione della pidginizzazione di Rachel Kupepe. 
Sebbene l’inglese venga visto come il lessificatore 
principale di entrambe le lingue, in esse sopravvivono 
soltanto circa settecento radici inglesi (Smith 2006). 

Per assicurarsi che l’analisi non sia stata distorta da 
registri particolari o da particolari classi semantiche, un 
campione di mille parole saramaccane è stato messo a 
confronto con i suoi equivalenti nello sranan. Per comodità, 
sono stati usati dei dizionari online delle due lingue: per il 
saramaccano, il dizionario saramaccanoinglese prodotto dal 
Summer Institute of Linguistics; per lo sranan, il dizionario 
sranan-inglese, anch’esso prodotto dal Summer Institute of 
Linguistic, e il Wortubuku ini sranan tongo a cura di John 
Wilner. Il campione è stato messo insieme cominciando 
dalla A ed eliminando tutti i nomi propri, tutte le parole 
saramaccane per le quali non c'erano equivalenti in sranan 
e tutti quei termini che è poco probabile che fossero in uso 
nel diciassettesimo secolo. Le parole fonologicamente 
diverse ma derivanti dal medesimo etimo sono state 
trattate nello stesso modo. Su un totale di 1000 parole, 521 
erano le stesse nelle due lingue, mentre 479 erano diverse. 

La probabilità che due lingue derivate da un’unica lingua 
già sviluppata mostrino una differenza nel loro vocabolario 
di quasi il 50 per cento dopo poco più di trecento anni di 
separazione è molto bassa. Meno di un terzo di questa 
differenza è attribuibile all'elemento portoghese. Pit 
interessanti sono le parole composte. Esse normalmente 
compaiono più di frequente nelle lingue creole rispetto ai 
pidgin. I parlanti di pidgin possono sempre tornare alla loro 
lingua-madre per le parole; per i parlanti di creolo, invece, 
la lingua-madre è il creolo e la loro padronanza delle altre 
lingue (se c’è) è limitata. È risaputo che i pidgin hanno 
poche parole; perciò una delle prime cose che devono fare i 
bambini è espandere il proprio vocabolario, e la 
composizione offre un modo veloce e trasparente di farlo. 


Su 105 composti saramaccani, solo 16 sono stati trovati 
anche nello sranan. Questo ci consegna una differenza 
ancora maggiore tra i due vocabolari rispetto al campione 
totale delle mille parole. Considerato che il periodo pit 
ricco per l'informazione composta è quello immediatamente 
successivo all’inizio della creolizzazione, questo campione, 
per quanto più piccolo, è ancor più significativo. Altrettanto 
significativo è il fatto che molto meno della metà delle 
forme esclusivamente saramaccane - 34 su 86 - doveva la 
propria differenza al fatto che almeno un elemento del 
composto venisse dal portoghese. 

Dal momento che i vocabolari delle due lingue non sono 
mai stati comparati scrupolosamente, è possibile (ancorché 
improbabile) che uno studio più esaustivo modifichi questi 
risultati. Tuttavia la demografia storica del Suriname 
conduce con ogni evidenza a formulare la predizione che 
un pidgin instabile, relativamente poco sviluppato e 
altamente maccheronico avrebbe persistito fino agli anni 
novanta del seicento - e questa predizione è ampiamente 
confermata dai due vocabolari. Di conseguenza, dopo il 
1690, le due lingue devono essersi sviluppate in maniera 
separata e le loro somiglianze grammaticali possono essersi 
originate soltanto per via dell’operare della medesima GU 
ridotta all'osso sulla stessa variabile, un pidgin privo di 
struttura. 


LA CREOLIZZAZIONE ALLE HAWAII 


La pidginizzazione e la creolizzazione alle Hawaii 
potrebbero sembrare a prima vista come processi che 
hanno avuto luogo in circostanze diverse da quelle dei 
Caraibi. A parte portoghese e inglese, nessuna delle altre 
lingue di contatto era stata prima coinvolta in questo tipo 
di processi (o almeno, non nello stesso modo; un pidgin 
inglese-cinese era una lingua di contatto per i venditori, ma 


non per i lavoratori delle piantagioni, e non si è mai 
creolizzata). I lavoratori dello zucchero lavoravano sotto 
contratto, non erano schiavi. La zona non era 
originariamente una colonia ma, almeno nominalmente, 
uno stato indipendente con la propria lingua indigena. I 
bambini schiavi dei Caraibi non ricevevano un'istruzione 
formale, al contrario della maggior parte dei bambini (se 
non tutti) delle Hawaii; e, a partire dal 1890, 
quell’istruzione era (o almeno si supponeva che fosse) 
impartita in inglese. Eppure, i risultati da un punto di vista 
linguistico erano così simili a quelli dei Caraibi che molti 
studiosi delle lingue creole (Goodman 1985; Holm 1986, 
1988; McWorther 1994), seguendo Reinecke (1969), erano 
convinti, prima della pubblicazione di Roberts (1998), che 
CIH si fosse creato in virtù di qualche forma di diffusione 
delle lingue creole dell’Atlantico. 

Ci sono le differenze e ci sono le differenze che fanno la 
differenza. Le due cose non andrebbero confuse. Nessuno 
ha spiegato quali differenze linguistiche sarebbero state 
prodotte dalla diversità di condizione tra schiavi e 
lavoratori contrattualizzati. Infatti quella condizione era 
molto più simile di quanto si potrebbe pensare a prima 
vista: i lavoratori contrattualizzati alle Hawaii potevano 
essere multati o potevano finire in galera se infrangevano il 
proprio contratto; spesso erano picchiati e a volte 
addirittura uccisi; inoltre, durante uno sciopero dei 
lavoratori dello zucchero a Kauai negli anni venti (Reinecke 
1997), ci furono venti vittime - lo stesso numero di morti di 
alcune rivolte minori. La presenza di una lingua indigena 
complicava la faccenda e ritardava l’inizio del processo di 
creolizzazione, ma non aveva altri effetti osservabili. Le 
conseguenze della scolarizzazione possono essere state 
esagerate. Una distinzione importante che tracciano molti 
studiosi di acquisizione della seconda lingua è quella tra 
input linguistico e intake: «L'acquisizione della lingua non 
implica solo l’input linguistico, ma un input linguistico 


comprensibile» (Long 1996, p. 414). Che solo una parte 
relativamente piccola dell’input di inglese appreso a scuola 
diventasse un intake è suggerito da considerazioni come 
quelle di un osservatore dell’epoca, il quale fa notare: 
«Come lo studio del greco, l'inglese terminava a fine 
lezione» («Pacific Commercial Advertiser», 1888). Se si 
fosse trasformato in questo modo, ciò avrebbe contribuito a 
rendere davvero eccezionale il fatto che in CIH siano 
comparse delle caratteristiche del creolo. 

I fattori principali che hanno cospirato per produrre le 
lingue creole sono stati esattamente quelli descritti 
all’inizio di questo capitolo. La storia delle Hawaii 
rispecchia perfettamente il ciclo delle piantagioni là 
delineato. Dal 1830 al 1876 esisteva una piccola industria 
dello zucchero corrispondente alla fase dell’installazione 
delle fattorie nelle colonie dei Caraibi. All'epoca si andava 
sviluppando un pidgin stabile e in continua espansione, che 
era però basato più sull’hawaiano che sull’inglese (Roberts 
1995). Esso fu completamente destabilizzato 
dall’introduzione su vasta scala di manodopera straniera - 
un processo che ebbe inizio improvvisamente alla fine degli 
anni settanta dell'ottocento ed è proseguito senza sosta 
fino al 1930. In quel periodo vennero messi fianco a fianco 
lavoratori provenienti dalla Cina, dal Giappone, dalla 
Corea, da varie isole del Pacifico, dalle Filippine, da Porto 
Rico, dal Portogallo, dalla Norvegia, dalla Germania e dalla 
Russia, la stragrande maggioranza dei quali poteva 
comunicare solo tramite un pidgin maccheronico e 
fortemente instabile. In altre parole, tutti i fattori 
responsabili della creolizzazione nei Caraibi erano presenti 
anche alle Hawaii. 

Perciò nessuna delle differenze tra le condizioni alle 
Hawaii e quelle ai Caraibi invalida l’impiego delle Hawaii 
quale modello per comprendere la pidginizzazione e la 
creolizzazione come processi generali. Le ragioni per farlo 
sono ovvie: si tratta dell’unico creolo delle piantagioni per 


il quale abbiamo a disposizione abbondante materiale 
scritto per ogni stadio del ciclo pidgin-creolo. Per tutte le 
altre lingue creole non ci sono testimonianze sostanziali 
che a partire dal momento in cui ormai il processo di 
creolizzazione è già ben avviato, se non completato - e ce 
ne sono molte meno di quanto si vorrebbe per i periodi 
seguenti. Perciò è di vitale importanza descivere e 
analizzare i dati delle Hawaii con grande scrupolo e cura. 
Senza dubbio, la studiosa che ha i meriti maggiori per 
quanto riguarda la nostra conoscenza di quei dati è Sarah 
Roberts (1998, 2004), la cui paziente e scrupolosa ricerca 
d’archivio ha portato alla luce una quantità di informazioni 
mai raccolta prima dai ricercatori. Purtroppo la successiva 
analisi dei dati condotta dalla stessa studiosa presenta 
lacune molto serie, almeno per quanto riguarda tre aspetti. 
Sovrastima la misura in cui la prima generazione di 
parlanti di creolo avrebbe acquisito le lingue dei propri 
genitori e attribuisce al sostrato delle caratteristiche che 
compaiono ampiamente anche in altre lingue creole, 
sebbene CIH non contenga nessuna delle lingue di sostrato 
trovate altrove. (Il portoghese, un sostrato del CIH, era un 
lessificatore in papiamento!). Ma la lacuna più importante, 
che è poi forse la causa delle altre due, è una decisione 
incredibile su che cosa sia (o non sia) un parlante di creolo. 


Lo stato della generazione G2 


Nel suo primo lavoro, Roberts (1998) aveva mostrato in 
maniera convincente che CIH aveva avuto origine tra i 
bambini nati in loco e non tra gli immigrati adulti, una 
scoperta che aveva permesso di sbarazzarsi in maniera 
definitiva delle teorie di tipo diffusionista sulle origini del 
creolo (per esempio, Goodman 1985) per quanto riguarda 
le Hawaii. 

Tuttavia, nella sua dissertazione di dottorato, Roberts 
(2004) divideva la popolazione delle Hawaii in tre 


generazioni: G1 era formata dagli immigrati alle Hawaii, 
G2 era la generazione dei loro figli e G3 era quella dei figli 
di G2. Roberts afferma che «la seconda generazione prese 
forma negli anni ottanta-novanta dell’ottocento e fu 
raggiunta dalla terza generazione attorno al 1905» (p. 203, 
corsivo mio). Le parole in corsivo sono sfuggenti: intende 
dire che i membri della terza generazione erano nati allora 
o che allora avevano raggiunto la maturità oppure qualcosa 
di indeterminato tra queste due cose? In seguito, la sua 
tabella 4.4 non fa altro che aumentare il mistero, poiché le 
rispettive date di inizio sia per G2 sia per G3, nei quattro 
gruppi etnici principali di immigrati (cinesi, portoghesi, 
giapponesi e filippini), coprono un arco di trent'anni, 
durante i quali il quadro linguistico complessivo era 
cambiato in maniera drastica. Inoltre questi archi temporali 
si sovrappongono, e così i G2 filippini iniziano dodici anni 
dopo l’inizio dei G3 cinesi! Questo fatto da solo (oltre a 
ignorare il ruolo giocato dalla popolazione indigena) rende 
di per sé la divisione G1-3 di dubbia utilità per qualsiasi 
scopo linguistico. 

Ma questo ha un'importanza relativa a confronto di una 
mossa senza precedenti che Roberts (2004, p. 220) fa a 
questo punto: «Nella discussione che segue ... userò “P/C” 
come etichetta generale per PIH [pidgin inglese delle 
Hawaii] e CIH - in particolare per riferirmi al proto-CIH in 
un momento in cui non era ancora chiaramente distinto da 
PIH». Di conseguenza, l’ipotesi è che i parlanti della G1 
parlassero PIH, che G3 parlasse CIH e la generazione 
intermedia G2 parlasse «P/C». 

I dati non avallano tutto questo. Roberts non definisce 
mai «proto-CIH» né «P/C» in termini linguistici. Non cita 
alcun esempio di nessuno dei due, né ci da alcuna 
informazione circa qualsiasi caratteristica strutturale che li 
distingua. Anzi, il suo intero corpus non contiene un solo 
elemento che non possa, su basi puramente linguistiche e 
senza conoscere l'identità dei parlanti, essere assegnato 


senz’ombra di dubbio a PIH o a CIH. (Si veda la tabella 8.2 
per le sei caratteristiche distintive principali). In tutti gli 
esempi di CIH di cui vengono date informazioni sull’eta del 
parlante, questo/questa (con una sola eccezione) è 
definito/a come «un/una bambino/a» o «un/un’adolescente» 
o equivalenti. 


PIH CIH 
Tutti gli argomenti sotto- spesso sempre 
categorizzati espressi no 
Frasi complesse molto frequenti 

rare 

Frasi incassate no Si 
Marcatura sistematica TMA no Si 
Ordinamento SVO canonico no Si 
Sistema regolare di no Si 


determinanti 


Tabella 8.2. Caratteristiche grammaticali di PIH e CIH. 


Mettete a confronto i seguenti esempi tipici del primo 
CIH con (1)-(7), che sono esempi di PIH: 


14. 


15. 


16. 


17. 


18. 


19. 


That fella bin think he more smarter than me, but 
I never ’fraid for that thing he bin tell (1909). 
You bin say go up on roof and paint him but I no 
hear you say come down (1913). 

The Indian he bin get one gun; he bin shoot one 
cowboy (1916). 

William punch my father and blood bin come 
outside (1916). 

Sometime my father take me for I go look the 
horse race with him (1916). 

More better for I write the answer (1917). 


Questi esempi differiscono di poco dal CIH 
contemporaneo. PIH è diverso da CIH per quanto riguarda 


gli aspetti citati nella tabella 8.2, nella quale si mostrano le 
sei caratteristiche principali che sono costantemente 
presenti nel secondo e costantemente assenti nel primo. 
Perciò l'introduzione arbitraria di uno stadio intermedio 
non esistente non può essere giustificata su basi 
linguistiche. 

La decisione di Roberts di creare un qualche tipo di 
passaggio intermedio tra PIH e CIH non sembra poggiare 
sui dati, ma sulla convinzione (contraria a un punto su cui 
invece convergono tutti gli esperti nel campo di studi del 
bilinguismo, come si è già fatto notare) che un bambino 
possa avere soltanto una lingua-madre. Il suo ragionamento 
funziona così: se i bambini hanno acquisito la lingua dei 
genitori, devono averla acquisita prima di aver incontrato 
PIH; quindi qualunque sia il risultato di quell’incontro, per 
quanto simile al creolo in tutti gli aspetti linguistici, non 
avrebbe potuto essere la loro lingua-madre. Poiché una 
lingua creola è stata tradizionalmente definita, a differenza 
del pidgin, come una lingua che ha dei parlanti 
madrelingua, ne seguirebbe che qualsiasi lingua parlassero 
costoro non poteva essere una lingua creola. Si noti che 
questa argomentazione dipende in maniera cruciale dalla 
tesi che i bambini all’inizio del ventesimo secolo alle Hawaii 
padroneggiassero effettivamente da madrelingua la lingua 
dei propri genitori. Ma è vero questo? 


G2 e le lingue dei genitori 


Roberts (2004) cita numerosi estratti dai ricordi 
d’infanzia dei residenti delle Hawaii. La prima selezione (p. 
231) intende mostrare che i genitori usavano solo o 
principalmente la propria lingua-madre quando parlavano 
con i figli. Ma la domanda che conta davvero qui è se i 
bambini avessero sviluppato una padronanza della lingua 
dei genitori sufficiente per essere considerati madrelingua 
- con tutto l'insieme di conoscenze che il termine 


«madrelingua» suggerisce tanto ai linguisti professionisti 
quanto ai profani in merito a tali questioni. Infatti, se la 
risposta è no, la percorribilità dell’ipotesi che siano loro i 
vettori del trasferimento del superstrato è severamente 
compromessa. 

C’è un’ampia letteratura sul bilinguismo nei bambini, e 
gli studiosi (per esempio, Petersen 1988; Meisel 1989; 
Dopke 1998; Yip e Matthews 2000; Genesee e Nicoladis 
2009) convengono ampiamente sul fatto che «la 
padronanza della lingua va considerata il fattore 
determinante principale del trasferimento» (Yip e 
Matthews 2000, p. 193). In altre parole, i «bilingui 
bilanciati», bambini che hanno pressoché la stessa 
competenza in entrambe le lingue, raramente fanno dei 
trasferimenti tra le due lingue; mentre i «bilingui 
dominanti», bambini più competenti in una lingua che 
nell’altra, fanno sì dei trasferimenti, ma solo dalla lingua 
dominante a quella non dominante. Si potrebbe 
immaginare che, nel processo di creolizzazione, una lingua 
consolidata e strutturata fosse dominante rispetto al pidgin. 
È così, ma solo in senso socio-politico. Il significato di 
«dominante» in contesto linguistico non riguarda la 
condizione sociale o il grado di sviluppo di una lingua, ma il 
livello al quale ciascuna lingua viene usata e compresa da 
un individuo. A meno che i bambini non conoscessero molto 
bene la lingua parlata dai propri genitori, quella lingua non 
era la loro lingua dominante e la probabilità di un 
trasferimento del sostrato è molto bassa. 

C’è una sorprendente scollatura tra le tesi di Roberts (che 
i bambini fossero parlanti madrelingua della lingua dei loro 
genitori, ma non di CIH) e l'evidenza da lei stessa 
presentata, che indica esattamente l’opposto. Roberts 
(2004, p. 233) presenta sette estratti per mostrare che «i 
bambini avevano imparato la LF [lingua parlata in famiglia] 
in qualche misura» (corsivo mio). La misura nella quale 
l'avevano imparata è chiaramente mostrata dagli estratti 


stessi: «Non so parlare molto l’hawaiano»; «Non conosco 
abbastanza il cinese»; «Riesco a capire e a parlare solo un 
cinese da bambini»; «Facciamo una tale confusione 
[quando parliamo portoghese] che ci mettiamo a ridere»; 
«Non ho mai imparato a parlare la lingua portoghese, se 
non per alcune parole usate dai bambini»; «Un ragazzo 
giapponese raramente parla giapponese»; «Non so parlare 
il giapponese molto bene - a casa parlavo solo un 
giapponese pigeon” [sic]». 

Roberts ne arguisce che «costoro potessero avere in 
origine delle competenze nella loro LF», ma non porta 
alcuna prova a supporto. Ciò che rende la sua ipotesi 
particolarmente poco plausibile è che queste testimonianze 
«sono state scritte da studenti delle medie, delle superiori e 
dell'università» (p. 227), e cioè da persone che si trovano 
solo a pochi anni di distanza dalle esperienze che 
descrivono - una quantità di tempo troppo ridotta per 
causare la perdita o la distorsione dei ricordi (o delle 
competenze linguistiche!). La sua tesi successiva, che i 
bambini non hanno incontrato il pidgin fino a che non sono 
entrati a scuola, è supportata solo da tre estratti (p. 234; 
tutti e tre dal giapponese) e viene confutata da ciascuno 
degli altri esempi. 

Nel complesso, Roberts (2004) presenta un totale di 
ventinove estratti autobiografici presi da un database di 
731 autobiografie. Se essi rappresentano le prove migliori a 
supporto delle sue tesi, si può solo immaginare come siano 
le altre 702. Anche se concediamo lo stato di bilingue a G2, 
i parlanti di G2 erano chiaramente creolo-dominanti e non 
LF-dominanti. Abbiamo i loro proferimenti a testimoniare la 
loro fluidità nel creolo e la loro testimonianza diretta per 
quanto riguarda la loro scarsa padronanza della propria LF. 
Ricordate la tesi di Siegel secondo cui le clausole finali 
temporalmente flesse in CIH derivavano da costruzioni al 
congiuntivo del portoghese: qual è la probabilità che dei 
bambini, che quando parlavano portoghese «facevano una 


tale confusione» da scoppiare a ridere 0 sapevano usare 
solo «alcune parole usate dai bambini», maneggino con 
padronanza i congiuntivi del portoghese? 

L'unica conclusione che si può trarre sulla base dei dati 
delle Hawaii è che i bambini hanno creato CIH nell’arco di 
una sola generazione e che non l'hanno fatto (e non 
potrebbero averlo fatto) estrapolando le strutture mancanti 
del pidgin dalla loro LF, poiché non avevano una 
conoscenza sufficiente di quest’ultima. Quindi devono aver 
usato l’unica fonte possibile di conoscenza strutturale, un 
programma biologico innato e universale per il linguaggio, 
integrandolo con qualsiasi tipo di materiale potessero 
recuperare da PIH per riempire solo alcuni dei vuoti 
lasciati dalle sotto-specificazioni di quel programma. 


LE LINGUE CREOLE E L'ARGOMENTO UNIVERSALISTA 


I capitoli 6 e 7 hanno mostrato che sia la variazione e il 
cambiamento nel linguaggio sia la sua acquisizione 
primaria sono ugualmente e interamente compatibili con la 
teoria del linguaggio che sto presentando qui. Ma nessuno 
dei due fornisce un argomento che permette di escludere in 
maniera esplicita le teorie alternative come invece fa la 
creolizzazione. 

Per quanto alcuni generativisti si siano affrettati ad 
accogliere qualsiasi teoria facesse riferimento alla GU, e 
malgrado ci siano stati alcuni tentativi (per esempio, 
Roberts 1999; si vedano anche i commenti a Bickerton 
1984b) di identificare le caratteristiche del creolo con le 
impostazioni predefinite dei parametri linguistici, nessun 
linguista generativista ha provato a incorporare in maniera 
sistematica le lingue creole all’interno di una teoria 
generale del cambiamento e dello sviluppo linguistico. Né 
vi è alcun accordo tra i generativisti in merito al ruolo 
preciso che le origini del creolo giochino nella teoria 


generativa. Di conseguenza, i pochi generativisti che si 
sono specializzati nelle lingue creole si sono sentiti liberi di 
adottare visioni diametralmente opposte su come si fossero 
originate tali lingue, anche in riferimento alla medesima 
lingua creola. Per esempio, sebbene entrambi si occupino 
quasi esclusivamente di haitiano, DeGraff (2007) sostiene 
che le lingue creole si siano sviluppate a partire dai propri 
lessificatori principali attraverso dei normali processi di 
cambiamento linguistico, mentre Lefebvre (1999) sostiene 
che le lingue creole preservino le strutture delle 
grammatiche del sostrato ri-lessificandole (esprimono 
quelle strutture tramite forme lessicali prese dal linguaggio 
dominante). Altri approcci al linguaggio, inclusi quelli di 
stampo empirista, hanno avuto da dire sulle lingue creole 
ancor meno cose dei generativisti. In breve, nessuna teoria 
del linguaggio precedente è stata capace di fornire una 
spiegazione coerente di come e perché le lingue creole si 
siano originate e di come abbiano acquisito l’ampio insieme 
di caratteristiche che le accomuna. 

Come ha mostrato questo capitolo, le lingue creole si 
sviluppano quando delle forze sociali, storiche e 
demografiche cospirano in modo da impedire ai bambini il 
pieno accesso a una lingua preesistente. In quelle 
circostanze, i bambini continuano a fare quello che sono 
programmati per fare: usano gli algoritmi per la 
costruzione delle strutture linguistiche forniti dalla GU; ma, 
in questo caso, invece di limitarsi a adottare un insieme di 
strategie per rimediare alle sotto-specificazioni già usate in 
un’altra lingua, prendono dei frammenti di materiale 
linguistico da altre lingue e riempiono le lacune adottando 
le strategie più semplici e dirette consentite da quei 
materiali. Non c’è nulla di eccezionale in tutto questo. 
Nelle lingue creole c’è poco, se non addirittura nulla, che 
non possa ritrovarsi anche altrove nel linguaggio e nel 
«normale» cambiamento linguistico (sebbene solo nelle 
lingue creole un grande numero di fenomeni rilevanti 


appaiano simultaneamente). C’è soltanto quella che, se 
tutti gli input linguistici sono affetti da «povertà dello 
stimolo», si può solo descrivere come una «pauperizzazione 
dello stimolo» - una riduzione nella qualità o nella quantità 
degli input che va ben al di sotto dei livelli riscontrati 
altrove. 

Può sembrare che i tre capitoli precedenti ci abbiano 
portato lontano rispetto al nostro obiettivo originario. Ma 
se la congettura ispirata di Darwin - che i «poteri» degli 
esseri umani sono venuti dall’«uso continuo di un 
linguaggio perfetto» - è corretta, è essenziale che noi si 
sappia esattamente che cosa fosse quel linguaggio e come 
e perché esso si sia sviluppato come in effetti ha fatto. Per 
dimostrare che il resoconto del linguaggio proposto qui è 
corretto, o almeno che si avvicina all'essere corretto più di 
quelli precedenti, è necessario illustrare come esso spieghi 
i dati meglio di quanto non facciano le teorie alternative - 
in particolare nei campi del cambiamento, dell’acquisizione 
e della creolizzazione. Fatto questo, possiamo ritornare al 
problema di Wallace e prendere in considerazione una 
soluzione che, tra le altre cose, dovrebbe finalmente 
consegnare alla storia il pluridecennale dibattito tra 
innatisti ed empiristi sulla natura del linguaggio. 


9 
«HOMO SAPIENS LOQUENS» 


Forse, la cosa piu confortante che ho scoperto scrivendo 
questo libro è stata questa: quasi tutti coloro che hanno 
tentato di spiegare come gli esseri umani si siano evoluti 
avevano ragione su qualcosa. Sono pochi i fattori di cui si 
fa menzione nella letteratura che non trovano posto in 
qualche punto della storia. 

Questo è il lato positivo. Quello negativo è che, come la 
Regina Bianca in Alice nel Paese delle Meraviglie, 
decisamente troppi tra coloro che scrivono in questo campo 
di ricerca riuscivano a credere a sei cose impossibili prima 
di fare colazione. Riuscivano a credere che, a differenza di 
ogni altra specie, gli esseri umani abbiano sviluppato delle 
capacità uniche e altamente specifiche senza prima aver 
avuto una qualche interazione altrettanto unica e altamente 
specifica con il proprio ambiente. Riuscivano a credere che 
quelle capacità fossero cresciute e sbocciate in una sorta di 
vuoto neurale, mentre il cervello umano se ne stava passivo 
a guardare - certo, aumentando di volume, ma senza 
sviluppare alcun meccanismo specializzato per 
implementarle. Riuscivano a credere che le scimmie 
fossero i modelli migliori per studiare i nostri antenati 
diretti, anche se noi parliamo e le scimmie no, noi 
cooperiamo e le scimmie no e noi produciamo una costante 
e apparentemente infinita sequenza di nuovi artefatti e di 
nuovi comportamenti, mentre le scimmie attraversano i 
millenni senza fare nessuna delle due cose. Riuscivano a 
credere che «i mattoni del linguaggio» (Lorenzo 2012, p. 
289) fossero disseminati su un ampio range di specie, in 
attesa di essere magicamente assemblati nel cervello di 


una qualche scimmia particolarmente fortunata. Riuscivano 
a credere che il centro diretto dei loro interessi - qualsiasi 
esso fosse: linguaggio, cooperazione, cognizione - fosse per 
lo più separato dagli altri centri d’interesse, i quali, nel 
migliore dei casi, avrebbero potuto giocare un ruolo di 
supporto. Riuscivano a credere che il centro dei loro 
interessi - qualsiasi esso fosse - avesse una sola causa 
principale. 

Se si occupavano di linguaggio, la causa avrebbe potuto 
essere la caccia o gli utensili o la competitività sociale, la 
scelta della femmina o la cura dei piccoli. Se si occupavano 
di cooperazione, la causa avrebbe potuto essere l’altruismo 
reciproco o la selezione parentale o la scoperta e la 
punizione di chi imbrogliava. I soliti sospetti venivano 
radunati e messi in fila e, nel caso in cui non si riuscisse a 
trovare il colpevole, la risposta era: «Be’ devono essere 
tutti colpevoli». E in un certo senso, era proprio così, 
ovviamente. Ma un caso di cospirazione non può essere 
risolto se prima non è stato portato alla luce il complotto. 


LE TRE STANZE E LA SCALA MOBILE 


Con il senno di poi, appare ovvio che qualsiasi cosa 
presenti il livello di complessità degli «elevati poteri» 
umani avrebbe potuto essersi originata solo tramite una 
storia lunga e tortuosa, nella quale ogni singolo episodio di 
una lunga serie ha avuto il ruolo di accelerare quello 
successivo. Un indizio cruciale per la soluzione del 
problema di Wallace è proprio una di quelle cose che lo 
rendono così tanto oscuro: l'immensità del divario cognitivo 
tra esseri umani e altre specie. Il fatto che non ci siano 
specie dotate di capacità cognitive intermedie tra lo 
scimpanzé e l’essere umano deve per forza dirci qualcosa. 

C'è una varietà immensa di specie sulla Terra che 
occupano ogni genere concepibile di nicchia. Se fosse stato 


possibile trovare una nicchia che conferisse qualcuna delle 
facoltà proprie degli esseri umani, alcune specie 
l'avrebbero già trovata. Questo suggerisce due cose. Una è 
che tutti gli «elevati poteri» - linguaggio, cognizione, 
cooperazione, autocoscienza - sono in qualche modo 
strettamente connessi tra loro. L'altra è che una specie con 
facoltà intermedie tra scimmie e umani non è possibile. 
Non c’è un mezzanino nel palazzo della natura. Se si sale 
sulla scala mobile, si va direttamente al piano di sopra. 

Tuttavia va tenuto a mente che la scala mobile potrebbe 
non essere stata la spirale co-evolutiva spesso invocata da 
coloro che hanno scritto di evoluzione. Fino a un paio di 
centinaia di migliaia di anni fa, gli utensili e i 
comportamenti degli antenati degli umani moderni erano 
molto meno diversi da quelli delle scimmie di quanto non 
siano rispetto a quelli degli umani moderni. Per trovare 
un'immagine appropriata, dovremmo pensare a una serie di 
stanze attraverso le quali si deve passare prima di 
raggiungere la scala mobile. La porta che conduce a quelle 
stanze è solo una. Se non si riesce a passare attraverso 
quella porta, non si arriverà mai alla scala mobile. 

La prima stanza è la nicchia dello saprofagia conflittuale. 
Lì, gli esseri umani hanno acquisito le basi della 
cooperazione: nessuno avrebbe mangiato, se non si fossero 
messi tutti insieme, parenti o no, per assicurarsi la 
carcassa. Ancor più importante: in quella stanza è stato 
acquisito il riferimento dislocato. Acquisire il riferimento 
dislocato è un modo, forse l’unico, per accedere alla 
seconda stanza. Per lo meno è l’unico modo emerso in 
miliardi di anni di evoluzione per liberarsi della camicia di 
forza della normale comunicazione animale - per 
abbandonare il qui-e-ora e raggiungere le distese illimitate 
del tempo, della distanza e dell’immaginazione. 

Nella seconda stanza c’è il simbolismo. È la stanza su cui 
non possiamo essere completamente certi. In tutte le 
stanze tranne in questa vale la seguente regola: non puoi 


limitarti a restare in quella stanza e non puoi andare da 
nessun’altra parte che non sia la prossima stanza. Ma 
davvero, dopo aver acquisito il riferimento dislocato, si 
deve procedere per forza nella direzione del simbolismo? 
Chiaramente no, poiché per le api e per le formiche non é 
stato così. Ma gli effetti del dislocamento su organismi con 
cervelli minuscoli devono essere certo differenti da quelli 
su cervelli di diversi ordini di grandezza piu voluminosi, 
che possono contenere descrizioni del mondo pit raffinate 
e che sono costantemente impegnati in qualcosa di 
sconosciuto alle formiche e alle api - i ricchi e variegati 
schemi dell’interazione sociale tra animali dalla forte 
individualità. Inoltre conosciamo il risultato: noi 
disponiamo di un simbolismo illimitato, mentre api e 
formiche no; e io non sono a conoscenza di altre strade 
egualmente probabili attraverso le quali il simbolismo 
avrebbe potuto essere acquisito. 

Una volta che il simbolismo sia entrato in funzione e 
venga usato, per quanto da modi di comunicare e formulare 
pensieri probabilmente ancora rozzi, l'ingresso nella terza 
stanza diventa inevitabile. A questo punto, il cervello fa la 
sua parte. Una delle cose più strane circa la letteratura 
sull'evoluzione umana è la rarità con cui si fa riferimento 
alla capacità del cervello di auto-organizzarsi. Tale capacità 
non è affatto una gran notizia: negli ultimi decenni è stata 
oggetto di studi comparativi e, se ci si sofferma un attimo, è 
uno di quei fatti evolutivi che possono essere considerati 
inevitabili. I cervelli devono essersi auto-organizzati e ri- 
organizzati innumerevoli volte nell'ultimo mezzo miliardo di 
anni, man mano che le varie specie incrementavano e/o 
modificavano la propria dotazione sensoriale. Se i cervelli 
non fossero cambiati in modo da elaborare il nuovo genere 
d'informazioni che ricevevano, le specie in questione 
avrebbero avuto un’idea radicalmente incompleta del 
mondo circostante e si sarebbero estinte in breve. 


Sappiamo inoltre che il cervello rende stereotipiche e 
automatiche certe azioni fisiche quali quella di gettare o di 
raccogliere cose, in modo che possano essere eseguite piu 
velocemente e in maniera più efficiente. Perché non 
dovrebbe fare lo stesso per le azioni mentali come pensare 
o pronunciare frasi? Comunque sia, la seconda di queste 
ultime due richiede dell’attività muscolare oltre all'attività 
neurale. Per il cervello, mentale, fisico, mentale-e-fisico 
sono una cosa sola: esso esegue tutto all’interno dello 
stesso codice di scariche elettrochimiche, schemi di 
attivazione e di non-attivazione neurale. Non è pensabile, e 
non dovrebbe esserlo, che una macchina che è in grado 
regolare al millesimo di secondo la finestra di lancio 
dell’azione del gettare debba andare in tilt, come se fosse 
sempre la prima volta, quando si tratta di mettere insieme 
dei gruppi di parole o concetti. 

Ma una ri-organizzazione così estesa come quella che ha 
dovuto affrontare il cervello umano è qualcosa che richiede 
molto tempo. Bisognava costruire una grande e fitta selva 
di interconnessioni locali (tra parole, tra parole e apparato 
fonatorio, tra parole e concetti, tra concetti e concetti). 
Delle autostrade neurali, come il fascicolo arcuato, 
dovevano connettere le regioni coinvolte più distanti tra 
loro. Per abbandonare la terza stanza, si dovette attendere 
che questo processo giungesse a compimento. 

Una volta che fu completato, gli esseri umani non 
potevano che salire ancora più in alto. A questo punto 
avevano a disposizione una macchina per pensare che non 
soltanto non aveva omologhi nel mondo animale, ma non 
aveva neppure rivali. È stato però proprio a questo punto 
che mente e linguaggio hanno cominciato a divergere. 

È facile confondersi qui, perché la relazione è mutevole. Il 
meccanismo prodotto dal cervello in origine rimaneva 
neutrale tra linguaggio e pensiero. C’era un unico 
meccanismo per la connessione delle parole e/o dei concetti 
a esse associati. Quando il cervello ebbe finito di ri- 


organizzarsi, questo meccanismo avrebbe potuto essere 
usato con efficienza massima per pensare e con efficienza 
minore per comunicare. Fin da allora, il pensiero è rimasto 
immutato attraverso le specie (sebbene quello che il 
pensiero poteva costruire sia aumentato in maniera 
esponenziale). 

Una volta presa la scala mobile, però, gli esseri umani 
hanno iniziato ad armeggiare con quello che oggi, 
correttamente, chiamiamo linguaggio. È stato mentre 
salivamo la scala mobile, e cioè negli ultimi 150 millenni, 
che abbiamo iniziato a provare in molti modi diversi - 
sempre di più, man mano che procedeva la diaspora umana 
- a porre rimedio alle molte sotto-specificazioni lasciate dal 
meccanismo messo a punto dal cervello per costruire le 
strutture. I modi di ovviare alle sotto-specificazioni e i 
«miglioramenti» del piano di base sono stati tanto numerosi 
che il piano stesso è praticamente scomparso dalla nostra 
vista - ed è diventato semplice per molti convincersi che un 
tale piano non esistesse, che il cervello non avesse mai 
sviluppato alcun meccanismo compito-specifico per il 
linguaggio. In un certo senso, costoro avevano ragione: 
tecnicamente parlando, i meccanismi non erano stati 
sviluppati per il linguaggio. Non erano stati sviluppati per 
nient'altro che non fosse alleviare i compiti del cervello e 
aiutarlo a preservare la propria energia. 

Ciò che ne aveva determinato la nascita era stata 
l'invenzione, a opera dei preumani, di segni dislocati, un 
processo che produsse dei risultati con cui il cervello 
dovette fare i conti. Ma l’uso che di quei meccanismi si fece 
in seguito era completamente indifferente, dal punto di 
vista del cervello. Sia pensare sia parlare implicavano 
l’organizzazione di una serie di eventi neurali secondo certi 
ordini particolari. 

Quando gli esseri umani si misero al lavoro per facilitare 
il compito dell’ascoltatore nell’elaborazione del linguaggio, 
le cose cambiarono. I meccanismi di costruzione delle 


strutture non potevano cambiare: erano una parte fissa del 
fenotipo umano. Si poteva, pero, acquisire una componente 
appresa - e nel capitolo 6 ci siamo fatti un’idea di quanto 
quella componente si potesse ramificare. Gli elementi 
culturali e biologici del linguaggio crebbero così 
strettamente legati che separarli non solo sembrava 
difficile, ma forse anche qualcosa di non necessario e 
addirittura scorretto. Era tanto semplice dire: «È tutta una 
questione di biologia» oppure «E tutta una questione 
culturale». 

Quanto detto ci consegna almeno le linee essenziali di 
una soluzione al problema di Wallace. Mente e linguaggio 
erano più di ciò di cui la natura avesse bisogno, perché solo 
il primo di questi quattro stadi era il risultato di particolari 
pressioni selettive che avevano operato in maniera 
specifica sugli antenati degli esseri umani. Il secondo 
stadio crebbe a partire dalla tendenza propria delle unità a 
riferimento dislocato di riferirsi in modo ancor più generale 
e astratto, fino a diventare, di fatto, delle etichette per i 
concetti mentali. Il terzo stadio consistette di operazioni 
puramente interne al cervello in risposta ai fenomeni 
inusuali che i primi due stadi gli avevano sottoposto, e non 
sulla base di una pressione selettiva che ha agito 
esclusivamente sugli ominidi. Il linguaggio naturale, così 
come lo conosciamo, ebbe inizio solo durante il quarto 
stadio; e, a quel punto, gli stadi precedenti avevano 
generato dei meccanismi il cui potenziale non aveva alcuna 
relazione con i bisogni ecologici degli esseri umani. 


L«USO CONTINUO» E IL FATTORE JOYCE 


Ma questo lascia ancora molto di inspiegato. Non sarebbe 
più semplice immaginare degli esseri umani primitivi dotati 
di un eloquio fluente come il mio o il vostro, ma con 
un'intelligenza pari a quella di uno scimpanzé? Se non è 


stato coinvolto un qualche fattore ulteriore, qualcosa di 
abbastanza diverso dal linguaggio, in che modo tanto la 
cognizione quanto la comunicazione hanno potuto cambiare 
in maniera cosi radicale negli ultimi pochi milioni di anni? 

A questo punto abbiamo bisogno di altri due indizi. Uno 
sta nella congettura originale di Darwin e riguarda la 
possibile funzione del linguaggio citata nel capitolo 1. 
Darwin era in genere molto attento al modo in cui usava le 
parole, perciò noi dovremmo prestare altrettanta 
attenzione al suo modo di usarle. Egli scriveva così: «Se si 
potesse provare che alcuni elevati poteri mentali, come la 
formazione di concetti generali, l’autocoscienza, ecc. sono 
assolutamente peculiari all'uomo, il che sembra 
estremamente dubbio, non sarebbe improbabile che queste 
qualità apparissero come il risultato incidentale di altre 
facoltà intellettuali altamente avanzate e queste ancora 
principalmente il risultato dell’uso continuo di un 
linguaggio perfetto» (1871, p. 101 [trad. it. p. 106], corsivo 
mio). L'altro indizio proviene da un luogo molto più inatteso 
ed è quello che potremmo chiamare il fattore Joyce. Questo 
ci ricorderà che «uso continuo» non significa solo «uso 
cosciente o intenzionale». 

In primo luogo, voglio sbarazzarmi di un malinteso di cui 
mi sento parzialmente responsabile, non avendo sempre 
seguito l'esempio di Darwin nell’usare le parole in maniera 
precisa. Sarebbe davvero troppo facile riassumere il 
messaggio di questo libro così: «La cognizione avanzata 
degli esseri umani è il prodotto del linguaggio». Questo è 
scorretto, persino come semplificazione. «Senza il 
linguaggio non sarebbe esistita la cognizione umana» è 
meglio, ma è comunque inadeguato. Si potrebbe proporre 
la seguente riformulazione: «Gli antenati degli esseri umani 
hanno iniziato a comunicare usando il riferimento 
dislocato; e questo è stato ciò che ha innescato il processo 
che alla fine ha condotto alla cognizione avanzata». Ma 


questo, per quanto piu accurato, non è uno slogan molto 
accattivante. 

Nel loro fondamentale articolo, Penn et al. (2008) 
considerano tre possibili versioni della tesi «il linguaggio è 
la causa della cognizione». La prima sosterrebbe che «le 
frasi del linguaggio naturale sono responsabili della 
disparità tra cognizione umana e non umana» (p. 121). 
Questo, di sicuro, non è quanto si afferma in questo libro. 
Non pensiamo per frasi, ma per successioni di impulsi, i 
quali, come detto prima, sono neutrali tra pensiero e 
linguaggio. La seconda versione afferma che «un qualche 
aspetto della nostra “facoltà del linguaggio”» (p. 121) è 
responsabile del divario cognitivo. Questo, però, si limita a 
riaffermare la tesi generale «il linguaggio è la causa della 
cognizione» in un modo che è piuttosto privo di significato, 
a meno che non si propongano dei candidati per quegli 
aspetti specifici. (Dei candidati improbabili discussi da 
Penn e colleghi includono la ricorsività e la forma logica). 
La terza versione attribuisce le differenze tra umani e non- 
umani alla «funzione comunicativa e/o cognitiva del 
linguaggio» (p. 121). Ma qui appare in maniera chiara la 
distanza tra i modi in cui il linguaggio potrebbe contribuire 
al pensiero individuati da Penn e colleghi e la proposta di 
questo libro. 

Essi dicono: «È piuttosto difficile immaginare come il 
fatto di comunicare usando frasi strutturate in maniera 
gerarchica possa essere stato in qualche modo d'aiuto 
senza la capacità di avere pensieri strutturati in maniera 
gerarchica» (Penn et al. 2008, p. 123). È molto più difficile 
vedere come ciascuno dei due avrebbe potuto esistere 
senza l’altro. Le concezioni secondo cui pensiero e 
linguaggio sono entità separabili in maniera netta, ciascuna 
con la propria infrastruttura, e secondo cui il linguaggio 
semplicemente «esprime i pensieri» sembrano molto 
naturali. Di certo, sono estremamente difficili da sradicare 
(si veda Bickerton 1992b e la risposta di Newell 1992). Ma 


la proposta che avanzo qui è che linguaggio e cognizione 
(almeno quegli aspetti della cognizione propri degli esseri 
umani) sono cresciuti a partire da un'origine comune e 
hanno le stesse fondamenta. 

Queste fondamenta sono duplici: la creazione di simboli 
che possono essere manipolati in maniera cosciente 
(l’ultima conseguenza dello sfruttamento della nicchia della 
saprofagia conflittuale) in combinazione con i mezzi per 
manipolare quei simboli, e quindi anche i concetti che quei 
simboli rappresentano, al fine di produrre delle nuove 
configurazioni (mezzi che sono derivati dalla 
riorganizzazione neurale necessaria ad agevolare il 
proferimento di parole e proposizioni). Perciò il punto non è 
che il linguaggio genera la cognizione umana; piuttosto, 
certi processi, di per sé né specificamente cognitivi né 
specificamente linguistici, danno origine allo stesso tempo 
a una cognizione e a un linguaggio propriamente umani. 

Secondo Penn et al. (2008), la differenza tra cognizione 
umana e non umana consiste nella capacità che gli umani 
hanno (e che i non-umani non hanno) di ragionare su 
relazioni astratte di ordine superiore, nelle quali gli oggetti 
o le categorie messi a confronto possono essere distinti 
solo sulla base dei loro ruoli o delle loro funzioni (amanti, 
madre, utensili, ecc.) invece che sulla base delle proprietà 
percettive o statistiche che hanno in comune. Sostengono 
che la capacità di fare questo non sia riducibile a nessun 
altro genere di operazione cognitiva; e di conseguenza 
ritengono necessario ipotizzare, oltre al resto 
dell’armamentario linguistico-cognitivo umano, anche un 
processo cognitivo specializzato - qualcosa che descrivono 
come «reinterpretazione relazionale». 

Concediamo pure alla loro tesi che ragionare su relazioni 
di ordine superiore non sia riducibile a nessun’altra 
operazione singola e distinta. Anche così, l'ipotesi che ci 
siano dei meccanismi mentali aggiuntivi rispetto a quelli 
che gli esseri umani sanno già di avere (e che 


richiederebbero anche l’introduzione di goffi neologismi) 
presta comunque il fianco alla lama del rasoio di Ockham. 
Inoltre, proporre qualsiasi meccanismo di questo tipo 
obbliga, prima o poi, a dover spiegare come quel 
meccanismo si sia evoluto. Non basta sostenere, come 
fanno Penn et al. (2008), che avrebbe aumentato 
l'adattamento individuale. Lo stesso avrebbero potuto fare 
molte altre cose - gli occhi dietro la testa, un senso che ci 
avvertisse di eventuali ostruzioni venose -, ma queste cose 
semplicemente non possono evolversi. In nessuno di questi 
casi c'è una variazione con cui la selezione naturale possa 
lavorare, né c’è alcuna pressione selettiva rispetto alla 
quale il meccanismo fungerebbe da risposta. 

Inoltre dobbiamo ancora considerare appieno le 
implicazioni della formulazione di Darwin - non sono state 
tanto le proprietà intrinseche del linguaggio ad aver dato 
origine alle facoltà umane, quanto piuttosto il suo uso 
continuo. È stato l’uso continuo - non del linguaggio in 
quanto tale, con buona pace di Darwin, ma dei materiali 
simbolici e strutturali di base dai quali esso sarebbe 
scaturito - ad aver reso possibile quella che era davvero 
una forma di cognizione completamente diversa. 

Fin qui, il pensiero umano è stato presentato come un 
processo tipicamente dinamico e diretto a uno scopo. Mi 
sono concentrato su cose come le complesse catene di 
pensieri che, come ha fatto notare Darwin, sono molto 
difficili da costruire senza l’ausilio di parole (anche se 
queste ultime non vengono proferite). Tali catene, 
naturalmente, rappresentano il punto più alto della 
cognizione umana. Sono ciò che ha reso possibile un 
numero potenzialmente infinito di scoperte sulla natura 
delle cose, così come molte invenzioni che, speriamo, 
miglioreranno la qualità della nostra nicchia. Ma rispetto 
alla loro quantità, queste catene di pensieri coscienti e 
formulati in maniera volontaria, essendo essi 
probabilmente inferiori allo 0,001 per cento della nostra 


vita mentale, sono molto meno della punta dell’iceberg. E 
la natura del resto di quella attivita - quella che si potrebbe 
chiamare la materia oscura della cognizione - che 
dovremmo prendere in esame ora. 


IL FATTORE JOYCE 


«Senti poi un profondo sospiro caldo, più debole, mentre 
la donna si rivoltava e gli anelli d’ottone ballonzolanti della 
lettiera tintinnavano. Bisogna mi decida a farli riparare. 
Peccato. Fin quassù da Gibilterra. Dimenticato quel po’ di 
spagnolo che sapeva. Chissà quanto l’ha pagato suo padre. 
Vecchio stile. Eh sì, naturalmente. Comprato all’asta del 
governatore. Venduto al primo colpo. Tenace nel 
contrattare, il vecchio Tweedy. Sissignore. Fu a Plevna. 
Vengo dalla gavetta, signore, e ne sono fiero. Eppure avevo 
abbastanza cervello da far soldi coi francobolli. Questo si 
chiama esser previdenti» [trad. it. p. 79]. 

In questo passo, tutto tranne la prima frase descrive i 
pensieri che attraversano la mente di Leopold Bloom - uno 
dei protagonisti dell’Ulisse (Joyce 1960) - quando, dopo 
aver portato la colazione a letto a sua moglie, la trova 
ancora addormentata e allora decide, saggiamente, di 
allontanarsi. Al suono prodotto dagli anelli di ottone 
quando lei si volta, la mente di lui si dirige sul letto e sul 
suo luogo di provenienza, fa un fugace riferimento alla 
moglie (la quale aveva vissuto a Gibilterra da piccola), per 
poi passare a colui che aveva acquistato il letto, suo 
suocero, ricordando le tipiche osservazioni di lui e 
mitigando la poca stima che all’inizio aveva dell’intelligenza 
di quell'uomo. 

La celebre tecnica del flusso di coscienza, di cui proprio 
Joyce fu il principale ideatore, prevede che si usino delle 
parole - come è giusto che sia, perché il flusso possa essere 
accessibile al lettore. Inoltre un romanzo deve 


necessariamente essere piu chiaro e ordinato di quanto non 
lo sia la vita stessa. Pur con questi limiti, la tecnica di Joyce 
ci consegna comunque un ritratto vivido di un genere di 
attività mentale che tutti noi esperiamo quotidianamente, 
quel casuale chiacchiericcio messo al bando tanto dai 
mistici quanto dai matematici perché interferisce sia con la 
meditazione sia con la concentrazione assoluta che è 
richiesta per risolvere problemi molto astratti. 

Il flusso di coscienza è stato materia di discussione per gli 
psicologi fin dal momento in cui James (1890) ha introdotto 
questa nozione. Ma l’enfasi è stata posta più sulla 
«coscienza» che sul «flusso»; e ci si è concentrati su cose 
come la «cecità al cambiamento» (Simons e Rensink 2005; 
Simons e Ambinder 2005), fenomeno nel quale, all’interno 
del campo visivo degli osservatori, si fanno accadere degli 
eventi di cui gli osservatori dovrebbero essere consapevoli, 
ma in realtà non lo sono. In effetti, molti studi si sono 
occupati soltanto dei flussi uditivi o visivi, ignorando il 
fenomeno che Joyce provava a catturare, nel quale si 
combinano elementi visivi, vocali, emotivi e di altro tipo. In 
questa sede, non prenderò in esame questioni come perché 
alcune esperienze siano coscienti e altre no o perché noi 
siamo autocoscienti - per quanto sia possibile che al 
secondo problema sia stata dedicata un’attenzione 
eccessiva. (Data la capacità di costruire delle narrazioni 
continue che hanno il sé come attore principale, è difficile 
vedere come si possa evitare l’autocoscienza). Qui voglio 
occuparmi solo dell’erratico saltare di qua e di là proprio 
del flusso joyceano, del suo tipico muoversi da un 
argomento all’altro, che è vincolato più da associazioni 
casuali che da qualsiasi comportamento focalizzato. 

Per cominciare, domandiamoci se altri animali abbiano un 
flusso di coscienza o se anche quest’ultimo sia un fenomeno 
limitato agli esseri umani. Delle evidenze disponibili, la 
maggior parte suggerisce che gli altri animali hanno 
probabilmente un qualche tipo di flusso di coscienza. 


Lorigine di questo fenomeno può essere soltanto questa: un 
neurone inattivo «a riposo» può essere attivato da altri 
neuroni che o si sono essi stessi attivati per svolgere una 
qualche funzione in cui il primo neurone non gioca nessun 
ruolo, oppure appartengono a una catena casuale di 
neuroni formatasi in occasione di attivazioni simultanee 
precedenti (probabilmente accidentali, talvolta). Dal 
momento che i cervelli dei mammiferi hanno uno schema 
simile, dai singoli neuroni fino all’architettura generale, 
non abbiamo ragioni di supporre che il flusso di coscienza 
sia un fenomeno unico dei cervelli umani. 

Questa posizione trova supporto nella natura dell’attività 
del sognare. C’é un’ampia e controversa letteratura su 
questo tema (si veda il numero speciale di «Behavioral and 
Brain Sciences» dedicato al sonno e al sognare, dicembre 
2000), che per la maggior parte si occupa di problemi che 
qui non ci riguardano (per esempio, se sognare sia 
un'attività limitata alla fase REM oppure abbia una qualche 
funzione adattiva). Ma, qualsiasi cosa faccia il cervello con 
le immagini che vengono generate in questo modo, l’ipotesi 
più probabile è che queste stesse immagini si generino per 
mezzo di quella che Fishbein (2000) descrive come 
«attivazione cerebrale caotica»; il fatto che il cervello possa 
attribuire in seguito una qualche funzione pratica a questo 
fenomeno - persino una funzione che sembra aver giocato 
un ruolo adattivo da un punto di vista evolutivo (Hobson 
2009) - non mette in discussione in nessun modo questa 
conclusione. Di certo, sono frequenti dei resoconti a 
carattere aneddotico sugli animali (in particolare i cani) 
che starebbero sognando di inseguire la preda. Se 
l'attivazione casuale è in ultima analisi responsabile dei 
sogni, allora il sognare e il flusso di coscienza sono 
modalità dello stesso fenomeno e differiscono per il fatto 
che censura e revisione sono meno restrittive durante il 
sonno. L'assunzione di partenza dovrebbe essere, quindi, 
che anche gli altri animali hanno un flusso di coscienza. Ma 


i gruppi di neuroni sollecitati sarebbero diversi da quelli 
sollecitati nel caso degli umani. 

Quando un concetto viene evocato nella sua versione non 
umana è improbabile che esso attivi altri concetti, dal 
momento che non è stato ancora sviluppato nessun 
meccanismo per collegare i concetti tra loro. Che un 
concetto attivi i percetti a esso associati o le reazioni 
comportamentali a ciò che esso rappresenta è molto più 
probabile di quanto non lo sia che attivi un altro concetto. 
Quando udiamo un cane emettere dei suoni concitati 
durante il sonno mentre muove velocemente i piedi, non 
possiamo essere certi che stia sognando - figuriamoci se 
possiamo sapere che cosa sta sognando; tuttavia il suo 
comportamento è sicuramente compatibile con il fatto che 
stia sognando di inseguire dei conigli. Sembra dunque 
ragionevole assumere che, se anche altri animali hanno 
flussi di coscienza, questi ultimi siano connessi molto più 
da vicino con l’esperienza passata dell'animale di quanto lo 
siano i nostri. 

Perciò, abbastanza presto nel ciclo di sviluppo umano, il 
flusso di coscienza inizierebbe a cambiare a ritmo molto 
lento. Naturalmente senza che il soggetto se ne renda 
conto. Ma tali cambiamenti coinvolgerebbero un aumento 
impercettibile della frequenza con cui un concetto ne attiva 
un altro. E, all'aumentare del numero di concetti connessi, 
aumenterebbero anche le possibilità che il flusso di 
coscienza metta in connessione concetti di norma non 
associati l’uno con l’altro. 

Un evento di questo genere è il luogo da cui provengono 
molte idee, in particolare quelle illuminazioni improvvise 
che poi di frequente hanno come risultato nuove scoperte e 
invenzioni. Talvolta pensiamo a quei momenti in cui 
esclamiamo «Ah!» come al prodotto di un’attività mentale 
cosciente e sottoposta al controllo volontario, e a volte lo 
sono, ma altrettanto spesso sono inattesi. La maggior parte 
di noi ha avuto esperienze di questo tipo, nelle quali la 


connessione tra due o più concetti, che prima ci 
sembravano completamente slegati, ci appare 
all'improvviso così chiara da lasciarci stupiti, e allo stesso 
tempo non riusciamo a capacitarci di come «possiamo non 
averci pensato prima» - o di come qualcun altro «possa non 
averci pensato prima». 

Sembra alquanto plausibile che il flusso di coscienza sia 
stato il mezzo attraverso il quale, in origine, è emersa la 
cognizione avanzata. A prima vista, questo processo non 
assomiglia a nulla che uno classificherebbe come 
«intelligenza». Al pari della sintassi, sarebbe al di sotto del 
livello della coscienza e della volizione, proprio come 
processi quali la respirazione o la digestione. Ma c’è una 
differenza tra «il pensiero non cosciente» e questi processi 
più chiaramente fisici. Il pensiero, che sia cosciente o 
meno, è connessione tra concetti. Ma i concetti, una volta 
evocati, inevitabilmente rimandano alle parole che li 
rappresentano. E le parole devono poter essere raggiunte 
dalla coscienza e dalla volizione perché (di norma) parlare 
è un atto volontario - e deve esserlo, dal momento che non 
si sa in anticipo quando ci sarà bisogno di dire qualcosa. Di 
conseguenza, può ben essere stato inevitabile che dei 
processi, iniziati come eventi casuali e incontrollabili, 
debbano poi essere diventati, con il tempo, suscettibili di 
essere convertiti in atti coscienti e volontari; questi ultimi 
miravano, con ogni probabilità, ad aumentare il prestigio di 
chi li pensava, ma hanno accidentalmente avuto l’effetto di 
contribuire all’incessante crescita dell’edificio della cultura 
umana. Per dirla in maniera semplice, per quanto un po’ 
cruda, può essere stato proprio per mezzo dei nostri 
pensieri involontari che siamo diventati capaci di pensare 
in maniera volontaria. 

Si noti che questo processo coinvolgerebbe una 
combinazione di fattori biologici legati allo sviluppo e di 
fattori culturali. Ovviamente, né le parole né i concetti 
possono essere ereditati direttamente. Ma la struttura 


complessiva del cervello, il numero di neuroni, la densita 
delle connessioni e le principali vie di attivazione possono 
tutti essere sotto il controllo diretto della genetica. Le 
parole e i concetti che le accompagnano sarebbero stati 
tramandati di generazione in generazione per mezzo della 
cultura. Le nuove generazioni avrebbero fatto delle piccole 
aggiunte alla dotazione originaria, assicurando cosi che il 
proto-linguaggio crescesse con quell’effetto simile a quello 
del dente d’arresto che è il marchio tipico dell’evoluzione in 
generale. 

Tutta la fioritura di sviluppi cognitivi che questo processo 
ha reso possibile avrebbe però dovuto attendere lo sviluppo 
di algoritmi per la concatenazione di parole e concetti. È in 
questo senso che l’«uso continuo» del linguaggio ipotizzato 
da Darwin - o, per essere più precisi, l’uso degli elementi 
che alla fine avrebbero dato origine al linguaggio - è stato 
responsabile di capacità mentali tanto in eccesso rispetto ai 
bisogni ecologici. 


PERCHÉ NON ABBIAMO BISOGNO 
DI CAPACITÀ ULTERIORI 


A questo punto, la domanda diventa che cosa questo 
resoconto non sia in grado di spiegare di ciò che è tipico 
della cognizione umana - sempre che ci sia qualcosa che 
non è riuscito a spiegare. Un’impressione diffusa sembra 
essere questa: l’enormita della cognizione umana richiede 
una spiegazione che rimandi a qualcosa di almeno 
altrettanto esotico, un qualche fattore esoterico diverso dai 
fattori piuttosto umili e ordinari descritti qui. Ci deve 
sicuramente essere qualcosa come una «ridescrizione 
rappresentazionale» (Karmiloff-Smith 1992), una «fluidità 
cognitiva» (Mithen 1996), una «miscela a doppio ambito» 
(Fauconnier e Turner 2002) o una «reinterpretazione 
relazionale» (Penn et al. 2008). Il fatto che ogni cinque anni 
sembri venir fuori un nuovo neologismo per il «fattore X» fa 


sospettare che questi termini siano, come il «principio 
dormitivo» di Molière, poco più che dei nomi nuovi per 
chiamare qualcosa di cui ancora si è alla ricerca. 

Torniamo di nuovo ai temi discussi in Penn et al. (2008): i 
tipi di problemi che, secondo gli autori, gli esseri umani 
possono risolvere e gli altri animali no. Si noti che le 
operazioni mentali specializzate discusse in seguito 
(confronto con un campione, riconoscere e seguire le 
regole, comprendere le relazioni spaziali, quelle 
gerarchiche e quelle causali e fare inferenze transitive) 
possono richiedere che chi le compie distingua relazioni 
basate su ruoli, funzioni o altri criteri astratti e non su 
caratteristiche fondate percettivamente. Ma le operazioni 
che coinvolgono qualsiasi grado di astrazione non sono 
accessibili a nessuna specie che non sia in grado di 
rappresentare delle astrazioni. 

Esistono degli altri fattori distintivi tra i problemi che gli 
animali sono in grado o meno di risolvere? In Penn et al. 
(2008) non se ne menziona nessuno, e non è chiaro quali 
debbano essere. Inoltre, lampia gamma di evidenze 
presentate da coloro che hanno commentato l’articolo - e 
largamente accettata da parte dei suoi stessi autori - 
illustra l’efficacia delle capacità di ragionamento non 
umane in molti mammiferi, uccelli e persino pesci. 
Ovunque esistano le caratteristiche percettive o ci siano 
chiare differenze statistiche, quelle capacità funzionano 
bene. I problemi sorgono solo laddove le conclusioni 
devono basarsi su astrazioni - su ruoli come la parentela o 
su proprietà come la commestibilità, e ancora di più 
quando vengono messe a confronto le relazioni tra cose 
invece delle cose stesse (per esempio, la relazione tra il 
lucchetto o la chiave è la stessa che c’è tra il cavatappi e la 
bottiglia o tra la buccia e la banana?). 

Di conseguenza, l’ipotesi nulla è questa: perché i moderni 
esseri umani acquisissero tutte le capacità che oggi 
dimostrano di avere, non serviva niente di più che le 


capacità cognitive degli altri animali e quella serie di 
processi che sono descritti in questo libro. I meccanismi 
simbolici e sintattici che quei processi hanno creato, una 
volta combinati con le capacita cognitive preesistenti, 
hanno agito come dei compressori, moltiplicando la forza e 
la portata di quelle capacita. Se siamo alla ricerca di 
continuita evolutive che vadano al di la della mera 
conformazione fisica, questo è il posto dove trovarle. Gli 
esseri umani non hanno alcuna capacità di ragionamento 
ulteriore. Hanno semplicemente lo strumento per 
aumentare le capacità che molte delle altre specie più 
complesse già hanno. 

Il motivo per cui quello strumento funziona tanto bene, 
dando l’illusione di essere un insieme di abilità mentali del 
tutto nuove ed emerse in maniera inspiegabile soltanto in 
una specie, la nostra, è che esso crea anche ciò che Mithen 
(1996) stava cercando di catturare con l’espressione da lui 
coniata «fluidità cognitiva». Come abbiamo visto in altre 
specie - dai ragni e dalle api alle ghiandaie americane, ai 
castori e ai pipistrelli -, il raggiungimento di alti livelli di 
abilità in capacità specifiche di una nicchia non si estende 
mai alla cognizione più in generale. Tuttavia un effetto 
della catena di processi qui descritti doveva fornire un 
codice comune a tutte le forme di attività mentale. Per dirla 
con le parole di Boeckx (2012, p. 498), esso conferiva «la 
capacità di combinare praticamente ogni concetto (preso 
da un qualsiasi sistema di conoscenze [di base]) con 
qualsiasi altro concetto (preso dallo stesso o da un altro 
sistema di conoscenze)» e così «metteva insieme i concetti, 
come si mischiano le mele con le pere, in virtù del loro 
essere tutti cose simili alle parole». 

Per quanto concerne le continuità specifiche all’interno 
della cognizione, non dobbiamo andare oltre il bisogno di 
determinare i rapporti di causalità. Questa è soltanto una 
parte, per quanto vitale, del bisogno più generale che 
hanno tutti gli organismi senzienti di costruire nelle proprie 


menti il modello piu comprensivo e accurato possibile del 
mondo. Più accurato è questo modello, più lunga e 
produttiva è la vita di chi lo costruisce. Di conseguenza, la 
selezione naturale favorirà qualsiasi cosa migliori 
l'accuratezza di quel modello. Per fare un esempio ovvio, 
un animale in grado di determinare se un fruscio nell’erba 
alta è causato da un soffio di vento o da un predatore che si 
avvicina di nascosto ridurrà le proprie possibilità di morire 
in maniera improvvisa e prematura. 

Chiaramente, modelli migliori e più completi del mondo 
producono un livello più alto di adattamento evolutivo. Il 
modello perfetto sarebbe quello che descrive in maniera 
completa tutte le cause. (Gli scienziati spendono intere 
carriere andando alla ricerca di piccoli pezzi di tale 
modello). Ovunque osserviamo delle uniformità sostanziali 
assumiamo che non si tratti di mere coincidenze. Se tutti 
gli oggetti privi di supporto cadono, deve esserci una causa 
per questo - che la si chiami «gravità» oppure «curvatura 
dello spazio-tempo». E dal momento che abbiamo le parole, 
non ci serve un concetto già pronto da etichettare. 
Possiamo fabbricarcene uno proprio a partire dalle parole 
(«qualunque cosa sia che fa cadere gli oggetti») e poi 
attaccarlo a qualsiasi attributo riteniamo appropriato. La 
nostra capacità di inferire la relazione di causalità è 
condivisa con molte altre specie animali. L'estensione di 
quella capacità su una gamma di fenomeni più ampia, 
compresi fenomeni più astratti come la gravità, è tutto ciò 
che produce la discontinuità in questo caso. 


ALCUNE CONSEGUENZE DI QUESTE PROPOSTE 


Proporre una soluzione al problema di Wallace non è 
proprio come risolvere un caso investigativo. È vero, in 
entrambi i casi qualsiasi proposta di soluzione deve passare 
attraverso le forche caudine della procedura di conferma: 


un processo, se si tratta di un crimine; il prolungato esame 
minuzioso da parte dei colleghi, inclusi tutti gli esperti in 
quel campo di studi, se si tratta di una teoria. Ma, nel 
primo caso, la soluzione originaria viene confermata piu 
spesso di quanto sia confutata. Nel secondo, invece, le cose 
stanno in maniera molto diversa. Nessuno sarebbe piu 
scioccato e sorpreso del suo autore se la teoria proposta 
qui dovesse essere accettata in maniera unanime e senza 
obiezioni. Semplicemente, nella scienza, le cose non vanno 
cosi. Mentre sono ragionevolmente sicuro che, alla luce di 
tutte le considerazioni fatte qui, nelle sue linee generali 
questa teoria debba essere corretta, molti dei dettagli 
andranno certamente rivisti, o sostituiti, quando vengano 
sottoposti al vaglio di un'ulteriore analisi attenta. 

Tuttavia la differenza che conta davvero riguarda le 
conseguenze. Quando un caso investigativo viene risolto, 
basta: il caso è chiuso. Una teoria di qualsiasi 
comportamento umano, invece, anche se dovesse 
dimostrarsi comprensiva e accurata, finisce inevitabilmente 
con il sollevare più domande di quante siano le risposte che 
dà, e suscita nuova ricerca in molte aree. Nel nostro caso, 
ci sono implicazioni per ulteriori studi su questioni molto 
distanti l'una dall’altra, come la costruzione delle frasi da 
parte del cervello e le cause e gli sviluppi del cambiamento 
linguistico. Ragioni di spazio impediscono di trattarle tutte 
in questa sede, ma due di esse sono di interesse 
sufficientemente generale da meritare un breve menzione. 
Vorrei chiudere questo libro discutendo la probabilità 
evolutiva di animali con capacità umane e il dibattito, 
vecchio di decenni, tra innatisti ed empiristi. 


Quanto erano probabili gli esseri umani? 


Secondo Gould (1989), l'emergere degli esseri umani era 
un evento del tutto non predicibile ed evolutivamente 
improbabile - un evento che, se «il film della vita» dovesse 


essere proiettato di nuovo, non accadrebbe pit. Opinioni 
simili sono state espresse da molti biologi (per esempio, 
Simpson 1964; Mayr 1995) e cosmologi (per esempio, 
Tipler 1980). Anche Conway Morris (2003), fiero 
sostenitore della convergenza evolutiva e avversario sia 
dell’interpretazione dei fossili di Burgess data da Gould sia 
della sua credenza nell’improbabilità dell’intelligenza 
umana, guarda a quest’ultima come a qualcosa che è poco 
probabile che ci si possa aspettare di trovare in altri mondi. 
Questo, però, non è lo scenario predetto dalla teoria che sto 
presentando qui. 

Ricordate che l’aspetto più straordinario di questa 
faccenda, quello che lasciò Wallace tanto confuso, è la 
totale assenza di specie di animali con capacità linguistiche 
e cognitive intermedie tra umani e grandi primati. Questo 
scarto non può essere spiegato dall’estinzione di specie 
intermedie nel lignaggio umano, nonostante la frequenza 
con cui i continuisti facciano appello a tali estinzioni. Come 
si è detto in precedenza in questo capitolo, anche se ciò che 
ha innescato la crescita delle capacità umane potrebbe 
essere accaduto due milioni di anni fa, la piena fioritura di 
quelle capacità è arrivata soltanto con l’avvento della 
nostra specie. Per diversi milioni di anni, dopo la 
separazione dalle altre scimmie, gli antenati degli esseri 
umani rimasero molto più simili alle scimmie da un punto di 
vista del comportamento di quanto non fossero ai moderni 
esseri umani, e così il divario cognitivo non è diminuito. 

Inoltre l’ultimo antenato in comune tra scimmie ed esseri 
umani può solo essere stata una qualche scimmia 
abbastanza ordinaria. Se è vero che il nostro lignaggio ha 
avuto inizio con quell’antenato per arrivare a concludersi 
con l’essere umano, passando attraverso molti stadi 
intermedi, allora è strano che nessun altro lignaggio di 
primati o di non-primati abbia attraversato quegli stessi 
stadi. Questo può essere successo solo se il primo stadio 
era già essenzialmente un preludio a tutto il resto, come 


accade nello scenario delle «tre stanze e la scala mobile» 
descritto precedentemente in questo capitolo. E le 
spiegazioni che si danno di solito dell’evoluzione umana, 
che individuano la sua forza trainante nell’incremento 
graduale di un intero pacchetto di comportamenti propri 
delle scimmie, non sono in grado di rendere conto di come 
un miglioramento in una qualsiasi di queste aree abbia 
potuto essere condizione necessaria per un miglioramento 
nelle altre. I vaghi discorsi sulle spirali co-evolutive non 
sono sufficienti, in questo caso. 

È sicuramente rilevante che, in contrasto con il 
conseguente isolamento degli esseri umani, ci sia un certo 
numero di specie all’interno di lignaggi ampiamente 
separati (primati: scimpanzé, bonobo, gorilla, orango; 
cetacei: delfini, balene, leoni marini; uccelli: ghiandaie, 
corvi, pappagalli) che sembrano essere a un livello 
pressoché simile di sviluppo cognitivo, tutte ammassate in 
fila davanti alla porta della prima stanza, per così dire. È 
come se ci fosse una qualche barriera a fermarle - se la 
potessero scavalcare, si troverebbero automaticamente 
sulla via per raggiungere il nastro in continuo movimento 
della scala mobile. 

La proposta di questo libro è che una breccia in quella 
barriera potrebbe essere stata aperta dalla comunicazione 
dislocata - qualcosa che, a sua volta, sarebbe stato 
raggiunto grazie agli sviluppi ecologici passati in rassegna 
nel capitolo 4. Se questo rappresenti o meno l’unico modo 
in cui si possa fare breccia in quella barriera, non proverò a 
determinarlo qui. Ma se anche fosse, c’è comunque ancora 
una forte possibilità che, su un pianeta che ospitasse forme 
di vita, qualche specie che abbia raggiunto il livello delle 
capacità cognitive degli scimpanzé, dei delfini o dei corvi 
adotterà, alla fine, una nicchia simile a quella che sul 
nostro pianeta è stata occupata dalle formiche, dalle api e 
dagli antenati degli esseri umani. Se questo accade, allora 


diventa forse inevitabile che ci siano altri pianeti che 
ospitano la «vita intelligente». 

Nelle settimane in cui sono state scritte queste righe, 
analizzando i nuovi dati raccolti dal telescopio Keplero, gli 
astronomi di Harvard hanno stimato che, nella sola Via 
Lattea, ci potrebbero essere fino a 17 milioni di pianeti 
delle dimensioni della Terra, una percentuale considerevole 
dei quali avrebbe orbite situate all’interno di una zona 
congeniale allo sviluppo della vita (Cowen 2013). La Terra, 
lungi dall'essere quell’anomalia nella galassia che molti 
credevano che fosse, è un pianeta ordinario, proprio come 
l’ultimo antenato in comune tra scimmie ed esseri umani 
era un primate ordinario. Ulteriori speculazioni sono 
premature, ma queste scoperte suggeriscono con forza che 
il gruppo di forme di vita su questi pianeti può differire di 
poco in relazione al livello di espansione cognitiva e che, di 
conseguenza, la «vita intelligente», ben lungi dall’essere 
un’anomalia rara o addirittura unica, può trovar posto in 
molti punti dell’intero universo. 

Nel frattempo, sulla Terra, i dati passati in rassegna in 
questo libro ci presentano la possibilità che l'evoluzione, 
ben lungi dall'essere quel processo casuale immaginato nel 
secolo scorso, possa essere abbastanza vincolata negli 
sviluppi che può intraprendere. Che essa possa essere 
strettamente determinata da leggi tanto biologiche quanto 
fisiche e chimiche, con un numero di opzioni chiaramente 
delimitato in ogni punto di cambiamento, è una possibilità 
la cui esplorazione dovrebbe costituire uno dei campi di 
ricerca più affascinanti per la scienza del ventunesimo 
secolo. 


Innatismo contro empirismo 


Come abbiamo già avuto l’occasione di notare ormai 
diverse volte, il dibattito che pare irrisolvibile tra innatisti 
ed empiristi si è protratto per parecchi decenni, a discapito 


della nostra comprensione del comportamento umano. 
Entrambe le parti, a parole, hanno rispettato l’idea che le 
caratteristiche innate interagiscono con quelle acquisite 
attraverso la cultura in ogni area del comportamento 
umano; ma quando si arriva a certe aree-chiave, in 
particolare la sintassi, tutte e due le parti si impuntano: gli 
empiristi insistono nel dire che non c’è alcun apparato 
compito-specifico, trasmesso per via genetica, per l’area in 
questione; mentre gli innatisti insistono nel dire che quasi 
tutto (se non proprio tutto) il comportamento in quell’area 
è sotto lo stretto controllo della biologia. 

Se la tesi di questo libro è corretta, l’inusuale persistenza 
di questo dibattito è dovuta al fatto che gli innatisti e gli 
empiristi hanno entrambi parzialmente ragione (sebbene 
abbiano entrambi anche parzialmente torto). Gli innatisti 
hanno ragione a supporre che la sintassi non potrebbe 
esistere senza una componente innata sostanziale, ma 
hanno torto nel supporre che questa componente includa la 
maggior parte delle strutture sintattiche, se non tutte. Gli 
empiristi hanno ragione a supporre che ci sia troppa 
variabilità nella sintassi perché questa possa essere 
interamente il prodotto di un qualche sistema universale 
specializzato, ma hanno torto a supporre che tutta la 
sintassi possa essere acquisita senza una sostanziale 
componente innata. Retrospettivamente, appare bizzarro 
che nessuno, in tutto questo dibattito, abbia proposto una 
distinzione di principio e sistematica tra quelle parti della 
sintassi che sono biologicamente date e quelle che devono 
essere state acquisite per via culturale, in una delle 
migliaia delle comunità di parlanti. 

Quello che avete appena letto rappresenta la prima teoria 
coerente della sintassi che traccia una distinzione di questo 
tipo, e in larga misura dipende da quella teoria. Vale anche 
la pena di notare che si tratta della prima teoria che abbia 
preso le mosse da una prospettiva evolutiva, invece di 
terminare con essa. Le teorie precedenti prendevano un 


qualche modello della sintassi come dato e solo dopo 
(sempre che lo facessero) si chiedevano come un tale 
modello potesse essersi evoluto. Questa teoria, invece, ha 
cominciato chiedendosi in che modo qualcosa come la 
sintassi possa essersi evoluto, e soltanto dopo ha 
considerato quale genere di sintassi potesse evolversi e se 
quel genere di sintassi potesse costituire il nucleo delle 
moderne lingue che siano dotate di sintassi. 

È troppo sperare che la soluzione offerta qui risolverà il 
dibattito una volta per tutte o lo consegnerà 
definitivamente alla storia? Sicuramente lo è. Studiosi 
reduci da mille battaglie, che portano onorevoli cicatrici e 
hanno passato anni in trincea, non sono molto disposti ad 
abbandonare le posizioni che hanno difeso per un’intera 
carriera. Diverso, invece, il discorso per i giovani studiosi 
all’inizio della loro carriera. 


CONCLUSIONE 


In ogni caso, risolvere il dibattito tra innatisti ed empiristi 
non era l’obiettivo di questo libro - anche se il fatto che una 
sua risoluzione emerga in maniera naturale, mentre si 
persegue un obiettivo differente, è indice sicuro che quella 
ricerca era indirizzata sui binari giusti. Qualunque debba 
essere il destino della soluzione che propongo qui, spero 
almeno di avere convinto il lettore di tre cose: 


1. Il problema di Wallace è un problema vero e sta al 
centro di qualsiasi tentativo di comprensione di che cosa 
siano gli esseri umani e del perché sono ciò che sono. 

2. Né Wallace né Darwin avrebbero potuto risolvere quel 
problema, poiché la conoscenza necessaria, solo una 
piccola porzione della quale è stato possibile citare qui, 
richiedeva di mettere insieme oltre un secolo di lavori 


condotti da migliaia di ricercatori specializzati in molti 
Campi di ricerca diversi. 

3. Data quella conoscenza, non abbiamo più bisogno di 
trattare il problema come un imbarazzante segreto di 
famiglia che, se discusso apertamente, potrebbe portare 
acqua al mulino dei creazionisti e di coloro che sostengono 
l'ipotesi del disegno intelligente. Il problema di Wallace si 
può risolvere, e si può risolvere solo facendo appello 
all’azione successiva di due forze che di norma operano 
nell'evoluzione (in questo caso, la selezione naturale e la ri- 
organizzazione neurale) insieme allo sviluppo seguente 
della cultura umana. I primi due fattori sono stati 
costantemente presenti, a livello individuale, per mezzo 
milione di anni di evoluzione; la loro interazione, sebbene 
più sporadica, era comunque frequente. Tuttavia, una volta 
soltanto quell’interazione è stata il risultato di tentativi di 
scambiarsi informazioni che andavano oltre i confini del 
qui-e-ora. 


La crescita sia del linguaggio sia della mente è 
cominciata, come nella famosa poesia di Robert Frost,” in 
quel punto cruciale in cui divergevano due strade - non in 
un bosco ingiallito, ma tra le alte erbe della savana che 
hanno lo stesso colore del manto dei leoni. Una strada, già 
molte volte battuta dai precedenti ominidi, conduceva 
soltanto a ossi da sgranocchiare, fughe dai predatori e 
sussistenza basata sugli scarti avanzati dagli altri. L'altra 
portava a una nuova nicchia, nella quale si dovevano sì 
affrontare i più feroci tra i predatori, ma in cui vi era anche 
una promessa di abbondanza. I nostri antenati presero la 
strada meno battuta; e questo, davvero, ha fatto tutta la 
differenza. 
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1 

In italiano la trasformazione dal dativo al doppio accusativo 
non esiste. Qui, come più avanti nel libro, quando il 
fenomeno sintattico descritto da Bickerton non ha un 
corrispondente in italiano gli esempi verranno lasciati in 
inglese [N.d.T.]. 


2 
Perifrasi per «evoluzione» [N.d.T.]. 


a 
La frase corretta in inglese sarebbe Two sheep are... 
[N.d.T.]. 


4 
Le parentesi quadre indicano i confini dei singoli 
costituenti della frase [N.d.T.]. 


5 

Sono le domande introdotte da parole quali «che cosa», 
«chi», «perché», «quando» e «dove», così dette in quanto i 
termini corrispondenti in inglese iniziano con wh (what, 
who, why, when, where) [N.d.T.]. 


6 

Lambiguita tra le due interpretazioni sorge perché in 
inglese è talvolta consentito omettere il pronome relativo 
that (si veda più avanti per una discussione di questo 
fenomeno) e perché withdraw può significare «prelevare» 
ma anche «ritirarsi» [N.d.T]. 


i 

Nell’enunciato (12a) («Luomo che Maria ha visto era 
Giovanni»), il confine è già marcato da Mary, che è 
argomento finale e soggetto di saw. Quindi that può essere 
eliminato. Nell’enunciato (12b) («Credo che Maria abbia 
detto che quell'uomo era Giovanni»), il primo confine, 
quello tra I think e Mary said the man was John, è già 
marcato da Mary, che è argomento finale e soggetto di 


said. Quindi that può essere eliminato. Il secondo confine, 
quello tra Mary said e the man was John, è marcato da the 
man, che è argomento finale e soggetto di was. Quindi, 
anche in questo caso, that può essere eliminato [N.d.T.]. 


8 

Le frasi-labirinto (in inglese garden-path sentences) sono 
enunciati che possono indurre l'ascoltatore a adottare 
un'analisi sintattica errata. Esse devono il loro nome 
all'espressione to lead someone up the garden path che 
significa, per l'appunto, «fuorviare qualcuno» [N.d.T.]. 


9 

In inglese il verbo race può significare «correre» e «far 
correre», quindi, leggendo la prima parte dell’enunciato 
(the horse raced past the barn), si può essere fuorviati a 
interpretarla come «il cavallo corse oltre il fienile». In 
questo modo, però, l’enunciato intero non è più 
interpretabile, perché non si riesce a combinare fell con il 
resto. Lo stesso accade nel secondo esempio: poiché il 
verbo dress può significare «vestirsi» e «vestire», leggendo 
la prima parte dell’enunciato (while Mary dressed the 
baby) si può essere fuorviati a interpretarla come «mentre 
Mary vestiva la bambina»; di nuovo, però, l’enunciato 
intero non è allora più interpretabile, perché non si riesce a 
combinare slept in her crib con il resto [N.d.T.]. 


10 

Ovvero pidgin. Pigeon in inglese sta per «piccione»: data la 
loro somiglianza fonologica, il parlante evidentemente 
confonde le due parole [N.d.T.]. 


11 
The Road Not Taken (La strada non presa) [N.d.T.]. 


